Apple учит гуманоидов с Vision Pro: человек показывает — робот делает

Apple учит гуманоидов с Vision Pro: человек показывает — робот делает

Apple учит гуманоидов с Vision Pro: человек показывает — робот делает

Исследователи из Apple совместно с MIT, Carnegie Mellon, Университетом Вашингтона и UC San Diego придумали интересный способ обучать гуманоидных роботов: надеваем Vision Pro, записываем действия человека — и робот учится повторять.

Да, это примерно как «смотри, как я делаю, и делай так же».

Команда собрала более 25 000 человеческих и 1 500 роботизированных демонстраций — получился датасет PH2D. На его основе они обучили единую модель, способную управлять настоящим гуманоидом в реальном мире.

Смысл в том, чтобы использовать видео от первого лица: человек взаимодействует с предметами — открывает ящики, переставляет вещи, нажимает кнопки. А робот потом учится делать то же самое, не нуждаясь в дорогом ручном управлении.

Для съёмки использовали приложение для Apple Vision Pro, которое задействует камеру в нижней части устройства и ARKit для отслеживания 3D-движений головы и рук.

Чтобы сделать всё подешевле, учёные придумали простое 3D-печатное крепление для камеры ZED Mini Stereo, чтобы использовать её с гарнитурами вроде Meta (корпорация Meta признана экстремисткой и запрещена в России) Quest 3. Получилось почти то же самое — но дешевле и доступнее.

 

Замедлить, чтобы успеть

Поскольку человек двигается намного быстрее, чем робот, все человеческие демонстрации замедлили в 4 раза. Так роботу проще учиться без дополнительных переделок.

Human Action Transformer (HAT)

Главная звезда исследования — модель HAT (Human Action Transformer). Её особенность в том, что она обучается на данных от людей и роботов одновременно и не делит их по источникам. В результате получается универсальная политика, которая работает на любых «телах» — человеческих или механических.

И это даёт результат: в тестах роботы, обученные по такой схеме, справлялись даже с незнакомыми задачами — лучше, чем при обычном подходе.

Сотрудницу уволили за пранк с использованием дипфейка

Сотрудницу одного из маркетинговых агентств уволили из-за неудачной шутки с использованием сгенерированного изображения. На картинке якобы была запечатлена сотрудница налоговых органов, проводящая проверку в офисе компании. Этот случай называют первым подобным инцидентом в России.

О произошедшем сообщил телеграм-канал SHOT. По его данным, 26-летняя сотрудница разместила в корпоративном чате фотографию, на которой «налоговый инспектор» якобы находился в офисе агентства с проверкой.

Появление изображения вызвало панику и серьёзный переполох среди коллег.

Позже выяснилось, что фото было сгенерировано нейросетью. Сотрудница регулярно использовала ИИ для создания изображений, в том числе на основе реальных интерьеров офиса, и ранее такие эксперименты не вызывали негативной реакции. Однако изображение с участием якобы представителей налоговых органов оказалось исключением.

После того как стало известно, что картинка является дипфейком, сотрудницу уволили. По её словам, она не расстраивается из-за произошедшего и уже ищет новую работу.

RSS: Новости на портале Anti-Malware.ru