Наземные роботы будут обучены получению демонстрационных команд, а не устных команд, для интерпретации, отслеживания, отзыва и применения в аналогичных контекстах в рамках нового исследовательского проекта армии, который начнется в этом месяце в Техасском университете в Остине.
Вначале автономные робототехнические системы будут обучаться процедурам тактического поведения с помощью телеоперации, и как только они узнают, где и как безопасно перемещаться по простой и сложной местности и преодолевать ее, они могут применять эти знания самостоятельно, когда сталкиваются с особо бурной, незнакомой территорией.
Исследователи из армейской исследовательской лаборатории Командования по развитию боевых возможностей армии США и университета будут совместно разрабатывать модели поведения автономных систем с использованием пакета программ автономной работы лаборатории. Стек, разработанный в рамках десятилетнего альянса Robotics Collaborative Technology Alliance, представляет собой набор программных алгоритмов, библиотек и программных компонентов, которые выполняют конкретные функции, которые требуются интеллектуальным системам, таким как навигация, планирование, восприятие, управление и рассуждение.
«Предоставление автономным системам возможности изучать новое поведение после выставления будет значительным шагом вперед в том, как армия обучает, утверждает и интегрирует автономию в подразделения», — сказал доктор Крейг Леннон, исследователь армии.
По словам Леннона, армия разрабатывает автономную систему для интерактивного обучения у солдата, и как только солдат понимает степень уверенности робота в применении обученного поведения к новым, сложным задачам, солдаты могут сделать осознанный выбор в отношении того, как использовать свои роботизированные системы.
Это может открыть возможности для роботизированных систем, которые изучают и выполняют новое поведение в операционных средах, не возвращаясь домой для проверки, сказал он.
Совет по оборонным инновациям выделил проблему в рамках тестирования и оценки систем при использовании методов машинного обучения. В своем отчете о принципах искусственного интеллекта 2019 года Правление указало, что «для систем, которые обучаются в течение всей своей жизни, остаются проблемы с постоянной сертификацией того, что эти системы не изучают поведение, выходящее за рамки предполагаемого использования».
Тем временем, сказал Леннон, корпоративная исследовательская лаборатория армии исследует потенциальные решения, чтобы найти методы, обеспечивающие гарантии для автономных систем, которые изучают реальные сценарии, такие как преодоление нового препятствия, на местах.
«Предположим, что робот уже изучил процедуры пересечения опасной зоны, но никогда не пересекал реку с грузом, который теперь требуется нести», — сказал он. «Во время репетиции миссии солдат находит реку в дружественной области, демонстрирует переход через реку, управляя полностью загруженным роботом, и повторяет демонстрации, пока система не сможет обеспечить уверенность в том, что она научилась безопасно выполнять поведение при соблюдении тактические процедуры для пересечения опасной зоны. Теперь солдат может взять его на задание, и он может перебраться через реку ».
Доктор Уфук Топку, ведущий исследователь этой работы в Техасском университете в Остине, сказал, что ранняя работа показала, как исследовательская группа может использовать существующие контекстные знания при обучении на демонстрациях.
«Получающиеся в результате методы повышают эффективность и обобщаемость данных и особенно перспективны для приложений армии, которым не хватает данных, и нуждающихся в проверке», — сказал Топку. «Мы с нетерпением ждем расширения методов и демонстрации их эффективности на экспериментальных платформах армии».
Леннон сказал, что демонстрации могут также понадобиться, чтобы научить робота действовать, будучи поврежденным, когда предыдущее поведение больше не работает.
Исследователи будут тестировать новое программное обеспечение на моделируемых системах в течение первого года. К середине 2022 года ожидается, что они передадут тесты бородавочнику Клирпат.
Ожидается, что трехлетнее соглашение о сотрудничестве между армией и университетом приведет к созданию системы, которая может в интерактивном режиме извлекать уроки из человеческой демонстрации, постоянно обновляя количественную оценку ее способности выполнять новое поведение и соответствовать требованиям системы обеспечения.