На размышления о том, что может сделать боты более успешными, наталкивают итоги минувшей конференции F8, на которой Facebook представил новые фичи своего Messenger в попытке вновь подогреть интерес к теме. Если обратить внимание на топ-5 раздела «Боты» на ресурсе Product Hunt, четыре из пяти продуктов будут представлены платформами для создания ботов. Однако хайп вокруг ботов, появившийся после презентации «ботостроительного» API, устроенной Facebook в 2016-м, до сих пор ни во что существенное не материализовался.
Этому есть несколько причин.
Во-первых, представление о том, что NLU, то есть распознавание ботом «естественного», разговорного языка в голосовых или текстовых интерфейсах — это «светлое будущее» всех визуальных интерфейсов, мягко говоря, ошибочно. Вспомните, насколько часто вам приходится решать такие комплексные задачи, как, например, поиск самого дешёвого авиаперелёта на ближайшие три месяца, и каким типом пользовательского интерфейса лично для вас удобнее при этом пользоваться. «Пропускная способность» различных способов получения и донесения информации (вы можете печатать, читать или воспринимать её на слух) явно неодинакова.
Во-вторых, владельцы подобных платформ — будь то Facebook с их Messenger или Amazon c Alexa - намеренно или нет, но позиционировали разработчикам ботов в качестве превосходного «движка» с искусственным интеллектом. Именно вследствие такого позиционирования у девелоперов и пользователей сложились ожидания, согласно которым боты представлялись им высокообразованными собеседниками-агентами, способными на сложные суждения и ответы. Вскоре стало очевидно, что того уровня NLU, который присущ человеку, общающемуся в чате, крайне сложно добиться на программном уровне, даже несмотря на все Wit.ai или Api.ai — инструменты, доступные разработчикам. Во многих случаях, когда бот кажется вполне естественным и удобным способом решения комплексной задачи, результат назвать практичным не получается. Приложение, за взаимодействие с которым в рамках мессенджера отвечает бот, находится в паре кликов, за пределами текущего диалога — и зачастую гораздо разумнее будет перейти туда, чтобы быстрее принять верное решение или получить более полный ответ.
Бесспорно, боты могут весьма грамотно работать в различных кейсах, однако разработка по-настоящему достойного бота — задача крайне сложная. Любой, кто пробовал создать бота с элементами NLU, подтвердит, что даже базовые опции диалога требуют обработки огромного количества возможных сценариев. И даже при этом большой пласт естественного поведения юзера останется за гранью понимания логики бота. В этом и кроется основополагающее отличие бота от приложения — разработчикам последнего не приходится продумывать и предусматривать все потенциальные вариации пользовательских действий.
Вдобавок, функционал даже у самых годных ботов будет, вероятнее всего, существенно ограничен — львиная доля опций и возможностей сохранится за традиционными и привычными приложениями. Именно поэтому самые популярные и удачные боты, к примеру, тот же Epytome Stylist для Messenger, полностью прозрачны в плане функциональности бота как такового. Это позволяет ему сочетать NLU с более привычными визуальными интерфейсами.
Несмотря на все рассмотренные выше ограничения и не особо впечатляющий старт, боты как новая платформа пользовательских интерфейсов несёт в себе превосходный потенциал. Главное — направить энергию разработчиков в нужное русло. Вот два перспективных направления.
Первое из них стоило бы назвать клиентоориентированным. Подобные боты должны быть «заточены» под автоматическое выполнение относительно простых задач. Суть полезности таких ботов — наглядное воплощение тезиса «save me clicks», то есть избавление юзера от лишних кликов и переключений между вкладками или приложениями. Представьте, что вы ищете наиболее быстрый или самый дешёвый способ перемещения из точки А в точку В.
Для того, чтобы выбрать один из нескольких вариантов, вы вынуждены учитывать разные маршруты, пробки и приблизительное время в пути по версии Google Maps, Waze или Moovit. Затем вам придётся перейти в приложения Uber и Lyft, сравнить цены и тарифы, а ещё проверить прогноз погоды... Самое удручающее в этой истории — то, что подобную процедуру вам предстоит проделывать каждый раз. С другой стороны, достаточно будет «скормить» желаемую локацию боту, знакомому с вышеописанными опциями, — и он мгновенно выдаст топ-3 вариантов, сформированный по принципу наибольшей выгоды в денежном эквиваленте или в сэкономленном времени. Без вопросов, без уточнений: раз — и готово. Ярким примером подобного бота может служить первый бот KLM, созданный при участии команд разработчиков KLM и Messenger.
Вторая категория стоит на страже интересов бизнеса. Здесь всё подчинено автоматизации повторяющихся и относительно простых взаимодействий и диалогов между потенциальными покупателями и продавцами. Речь идёт о заказе, оплате и получении ответов на так называемые FAQ — часто задаваемые вопросы. Во многих случаях подобные боты просто открывают веб-страницы внутри диалоговой оболочки. Так, например, в Messenger делает OpenTable.
Такого рода программы гораздо ближе к классическим браузерным расширениям, нежели к ботам в их нынешнем понимании: это уже не виртуальный собеседник, а способ «бесшовного» и органичного добавления традиционного пользовательского интерфейса внутрь диалогового окна. Да, порой приглашение «третьего лишнего» в чат может показаться неуместным, однако если речь идёт о выработке коллективного решения (расшарить для участников беседы музыкальную композицию или заказать машину, чтобы увезти всех собравшихся), это станет вполне естественным и разумным ходом.
Подобные расширения смогут по-настоящему избавить пользователя от лишних кликов и стать неотъемлемой частью многих бесед и диалогов. Благодаря именно таким ботам Facebook Messenger имеет шанс эволюционировать в более мощную экосистему, сопоставимую с WeChat. Главная трудность этого пути остаётся прежней — создание бесшовного механизма нахождения релевантных ботов. Станет ли «магазин ботов» Facebook панацеей — покажет время. Было бы любопытно увидеть метаморфозу такого порядка, при котором банальная всплывающая вкладка превратилась бы в органично встроенный в структуру чата поисковый движок, напоминающий механизм «упоминаний» в мессенжерах.
Автор оригинального текста — Alexandr Matsenov.