Исследователи из SUNY Binghamton, Университета штата Кливленд и Университета Вашингтона недавно разработали новую систему диалога, которая может улучшить взаимодействие человека с роботом. Эта система, представленная в документе, предварительно опубликованном на arXiv, предназначена для постоянного обучения на опыте диалога, со временем расширяя базу знаний и языковые возможности.
“В последние годы многие компании и исследовательские институты начали задумываться о разработке и использовании роботов в помещениях для различных применений”, – сказал Саид Амири, один из исследователей. “Для робота способность использовать естественный язык для общения с людьми имеет решающее значение. Однако есть несколько проблем в достижении этого. Одна из них заключается в том, что человеческий разговор может быть неоднозначным. Во-вторых, в отличие от людей, знание робота о его окружении (например, об объектах и людях вокруг него) весьма ограничено”.
В своем исследовании Амири и его коллеги решили устранить ограничения многих существующих диалоговых систем , разработав систему, которая может извлекать уроки из своего окружения и, таким образом, совершенствовать свои возможности с течением времени. Их общая цель состояла в том, чтобы позволить роботам успешно выполнить задачу, такую как доставка посылки, а также получение новых представлений об окружающей среде.
«В общении, если человек ссылается на какой-то неизвестный объект, роботу часто будет трудно его понять», – сказал Амири. «Для решения этой проблемы мы придумали идею диалоговой системы, которая задает уточняющие вопрос, как только человек назначит ему задачу. Такие вопросы помогают роботу в понимании, что он должен выучить новые слова”.
Диалоговая система, разработанная Амири и его коллегами, имеет четыре основных компонента: компонент понимания языка, менеджер диалога, менеджер знаний и инструмент генерирования языка. Компонент понимания языка анализирует предложения, произносимые людьми, в формальные представления, а затем передает их роботу. Когда диалоговая система применяется, например, к задаче доставки, такой как та, на которой исследователи сосредоточились в своих экспериментах, компонент понимания языка позволяет системе идентифицировать предметы, упомянутые пользователями, или информацию, связанную с получателем посылки.
Компонент диспетчера диалогов, с другой стороны, решает, какие вопросы робот должен задавать пользователям, если он не полностью уловил инструкции или предложения. Основываясь на ответе пользователя на эти вопросы, робот обновляет степень уверенности в значении понятий, на которые ссылается пользователь.
Впоследствии компонент менеджера знаний диалоговой системы определяет, должен ли робот изучать новую концепцию или нет. Если робот уже знает все ключевые понятия, описанные пользователем, нет смысла изучать дополнительные или ненужные слова.
Наконец, компонент генерации языка позволяет роботу генерировать ответы и напрямую отвечать пользователям. В своем исследовании Амири и его коллеги решили сохранить этот компонент как можно более простым и, таким образом, использовали ряд простых, заранее определенных текстов.

На картинке представлен обзор диалоговой системы, разработанной Амири и его коллегами.
Исследователи оценили свою систему как в симуляции, так и в экспериментах с участием людей, которые были набраны через Amazon Mechanical Turk и другие платформы. Их результаты были очень многообещающими, поскольку их система опережает других диалоговых агентов по взаимодействию человека с роботом, как с точки зрения эффективности, так и точности. В своих тестах система достигла хорошего понимания пользовательских запросов, а также постоянно обновляет свои знания и языковые возможности с течением времени.
«Во время нашего исследования мы попросили нескольких участников использовать нашего робота, и робот был способен расширять свои знания посредством диалога с пользователями», – сказал Амири. «Робот, обладающий способностью знать, когда изучать новые знания сам по себе, был большим достижением. Это означало бы, что вы можете иметь робота, который постепенно изучает новые концепции посредством взаимодействия и диалога с людьми».
В будущем система диалога, разработанная Амири и его коллегами, могла бы использоваться для расширения возможностей взаимодействия как существующих, так и новых роботов. Между тем, исследователи планируют продолжить работу над своей системой, чтобы еще больше улучшить ее производительность, эффективность и применимость.
“Несмотря на то, что мы достигли нашей цели в этом исследовании, предстоит еще долгий путь, чтобы робот действовал так же естественно, как человек”, – сказал Амири”. Теперь я хотел бы улучшить нашу диалоговую систему, чтобы робот мог говорить меньшее количество раз, иначе люди могут расстроиться и потерять доверие к роботу”.