Команда австралийских исследователей разработала надежную стратегию для тестирования физических способностей роботов-гуманоидов, которые по своей конструкции и дизайну напоминают форму человеческого тела. Используя сочетание методов и алгоритмов машинного обучения, исследовательская группа смогла дать возможность тестовым роботам эффективно реагировать на неизвестные изменения в моделируемой среде, улучшая их шансы на функционирование в реальном мире.
Результаты, которые были опубликованы в совместной публикации IEEE и Китайской ассоциации автоматики Journal of Automatica Sinica в июле, имеют многообещающие последствия в широком использовании роботов-гуманоидов в таких областях, как здравоохранение, образование, реагирование на бедствия и развлечения.
«Роботы-гуманоиды обладают способностью передвигаться разными способами и, таким образом, имитировать движения человека для выполнения сложных задач. Для того, чтобы это можно было сделать, необходима их стабильность, особенно в динамических и непредсказуемых условиях», – сказал Даченг Тао, профессор и научный сотрудник ARC в Школе компьютерных наук и на инженерном факультете в Сиднейском университете.
«Мы разработали метод, который надежно обучает гуманоидных роботов выполнять эти задачи», – добавил Тао, который также является первым директором Сиднейского центра искусственного интеллекта UBTECH.
Роботы-гуманоиды – это роботы, которые напоминают физические характеристики человека – голову, торс, две руки и ноги – и обладают способностью общаться с людьми и другими роботами. Оборудованные датчиками и другими устройствами ввода, эти роботы также выполняют ограниченные действия в зависимости от внешнего ввода.
Как правило, они предварительно запрограммированы для конкретных видов деятельности и основаны на двух видах методов обучения: на основе моделей и без моделей. Первый обучает робота ряду моделей, которые он может использовать для поведения в сценарии, а второй – нет. Несмотря на то, что оба метода обучения были в определенной степени успешными, каждой отдельной парадигмы оказалось недостаточно для того, чтобы обучить робота – гуманоида вести себя в предсказуемом сценарии, когда среда постоянно меняется.
Чтобы преодолеть это, Тао и его команда представили новую структуру обучения, которая включает в себя части как обучения на основе моделей, так и обучения без моделей, чтобы сбалансировать двуногого робота. Предложенный метод управления устраняет разрыв между двумя парадигмами обучения, где переход от изучения модели к изучению реальной процедуры был плавно завершен.
Результаты моделирования показывают, что предложенный алгоритм способен стабилизировать робота на движущейся платформе при неизвестных вращениях. Таким образом, эти методы демонстрируют, что роботы могут адаптироваться к различным непредсказуемым ситуациям соответственно и, таким образом, могут применяться к роботам вне лабораторной среды.
В будущем исследователи надеются проверить свой метод в более сложных средах с более непредсказуемыми и изменяющимися переменными и с различными размерами, поскольку они проверяют способности роботов осуществлять полный контроль над телом.
«Наша конечная цель будет состоять в том, чтобы увидеть, как наш метод позволяет роботу контролировать все свое тело, поскольку он подвержен неизмеримым и неожиданным помехам, таким как изменение местности. Мы также хотели бы увидеть способность робота узнать, как подражать движению человека, например, движению голеностопного сустава, без предварительной информации”.