В последние годы все большее число исследователей изучает использование роботизированных рук для решения различных повседневных задач. В то время как многие из них успешно справились с простыми задачами, такими как захват или базовые манипуляции, сложные задачи, которые включают в себя несколько шагов и точные стратегические движения, до сих пор решались трудно.
Команда исследователей из Китайского университета Гонконга и Tencent AI Lab недавно разработала основанный на глубоком обучении подход к решению кубика Рубика с использованием роботизированной руки с несколькими пальцами. Их подход, представленный в статье, ранее опубликованной на arXiv , позволяет руке решать более сложные задачи по манипулированию руками, такие как знаменитая головоломка Кубика Рубика.
Кубик Рубика – это пластиковый куб, покрытый разноцветными квадратами, который можно перемещать в разные позиции. Цель головоломки состоит в том, чтобы стратегически крутить и поворачивать секции куба, пока все квадраты на каждой из его граней не будут одного цвета.
«Видя, как некоторые исследователи используют руки робота с несколькими пальцами для выполнения задач, таких как вывешивание объекта и манипулирование инструментом, мы думали, сможем ли мы использовать руку робота для решения более сложных задач, таких как решение кубика Рубика», – сказал один из исследователей Тинггуан Ли..
Чтобы решить загадку кубика Рубика, используя ловкую руку, Ли и его коллеги разработали иерархическую модель обучения с глубоким подкреплением, которая, по существу, разделяет задачу на этап планирования и манипуляции. В своем исследовании исследователи применили этот подход к пятипалой руке под названием Shadow Hand .
“Задачи решения кубика Рубика с использованием руки робота двояки: во-первых, управлять рукой робота очень сложно, поскольку она имеет высокую степень свободы; во-вторых, решение кубика Рубика требует длинной последовательности движений”, – пояснил Ли. “Наша идея сочетает в себе алгоритм глубокого обучения, который имеет множество успешных приложений и человеческие знания. Цель состоит в том, чтобы показать ловкость руки робота и решить беспорядочно перемешанный кубик Рубика с высокой вероятностью успеха”.

Иерархическая модель, предложенная исследователями, имеет два ключевых компонента: один для планирования и один для манипуляции. Первоначально компонент планирования (решатель кубов на основе модели) определяет оптимальную последовательность режимов для решения головоломки. Затем контроллер манипуляции (оператор куба без модели) управляет пальцами руки, чтобы выполнить эти шаги.
«Наш подход имеет два уровня: верхний уровень планирует траекторию для решения кубика Рубика, состоящего из атомных действий, а нижний уровень учится реализовывать каждое атомное действие», – сказал Ли. «Атомные действия изучаются через модель глубокого обучения, избавляясь от ручного проектирования сложных контроллеров низкого уровня».
Исследователи обучили и оценили свою модель, используя симулятор высокой точности, который они также построили. Они проверили производительность своей модели в серии экспериментов, в которых виртуальной ловкой руке было подано 1400 кубов Рубика со случайным скремблированием, и выяснили, что в среднем она достигла 90,3 процента успеха.
«Мы показали, что рука робота с несколькими пальцами имеет огромный потенциал для сложных задач», – сказал Ли. «Интеграция алгоритмов, основанных на обучении, может помочь сократить тяжелую работу по ручному проектированию алгоритмов управления. Я надеюсь, что это привлечет больше исследователей в этой области и подтолкнет их к разработке новых подходов для дальнейшего повышения ловкости рук робота».
В отличие от ранее предложенных подходов, модель, разработанная Ли и его коллегами, позволяет выполнить более сложную задачу манипулирования руками, используя роботизированную руку, конкретно решая кубик Рубика. До сих пор исследователи оценивали свой подход только при моделировании, но теперь они планируют применить свой алгоритм на реальной руке робота.