Новая структура ускоряет процесс обучения роботов

Роботы из Стэнфорда придумали пару систем обучения, в которых люди выступали в роли учителей и родителей для машин, которые учились выполнять простые навыки. Эксперты приходят к выводу, что робот учил навык быстрее, если его обучал человек .

Фреймворки назывались RoboTurk и SURREAL. Каждая структура могла работать самостоятельно, но лучше всего работать вместе.

В RoboTurk человек использовал смартфон и браузер для отправки команд роботизированной руке в режиме реального времени. Человек руководил роботом, когда он захватывал предметы и выполнял другие задания.

Между тем, SURREAL позволил роботу просматривать более одного опыта обучения одновременно. Эта возможность параллельного просмотра значительно увеличивает скорость, с которой робот учится выполнять работу.

Исследователи из Стэнфорда объяснили, что их структуры работали путем объединения больших объемов данных и применения обучения с подкреплением в больших масштабах. Это сочетание записанной информации и ориентированного на человека обучения помогло роботам учиться и осваивать новые навыки. (Связанный: ИИ глубокого обучения может определить, какая песня играет в вашей голове .)

Люди могут обучать роботов, чтобы машины быстрее обучались

Стэнфордский исследователь Юке Чжу продемонстрировал полную структуру RoboTurk-SURREAL . Он использовал приложение RobotTurk на своем iPhone, чтобы направлять красную руку Роберта по имени Бендер во время теста.

Краткий эксперимент состоял из подбора работы. Бендеру-роботу было поручено распознать объект, поднять его и поднести к контейнеру с правильной этикеткой. Вся деятельность напоминала игровые киоски с НЛО, найденные в аркадах.

Движением своего телефона Чжу велел Бендеру выбрать правильную цель. Взаимодействие между ним и роботом было описано как подобное отцу и его механическому ребенку.

Роботы учатся двумя способами: либо изучают большие наборы данных, либо просматривают свою среду и взаимодействуют со всем, с чем сталкиваются. Последнее часто приводит к забавному виду случайного колебания рук робота.

Однако, если человек показывает роботу, что делать во время тренировки, он учится гораздо быстрее. Аналогичным образом родители держат руки своих детей, обучая их таким простым задачам, как мытье волос или чистка зубов.

Конечно, эффективность урока зависит от человека-помощника. Во время демонстрации RoboTurk Чжу ошибся в суждении и слишком сильно нажал на элемент управления. Бендер робот продолжил бросать мяч.

Роботы теперь имеют доступ к SURREAL.

Исследователи из Стэнфорда добавили как успешные, так и неудачные результаты RoboTurk в базу данных SURREAL об опыте обучения. Бендер и другие роботы могут извлечь из этого расширяющегося пула базовых знаний, если они когда-нибудь снова проведут тот же эксперимент.

Используя систему параллельного обучения SURREAL, робот может одновременно проходить тысячи симуляций. Возможность одновременного просмотра нескольких симуляций экономит много времени.

Чжу и его товарищи по команде уверены, что роботы станут важной частью повседневной жизни людей. Ожидается, что машины будут выполнять повторяющиеся задачи, которые считаются слишком опасными или слишком скучными для человека, такие как сбор урожая .

«Вам не нужно указывать роботу поворачивать его руку на 20 градусов, а дюйм вперед на 10 сантиметров», — сказал Чжу. «Вы хотите, чтобы робот мог пойти на кухню и принести яблоко».

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *