Робот ловко управляется с напитками, варит кофе, готовит тосты, ставит цветы в вазу и переносит мебель.
Китайский стартап AgiBot представил нового робота GO-1, оснащенного новейшей системой алгоритмов на базе фреймворка ViLLA (Vision-Language-Latent-Action) с последними функциями моделирования зрения, языка и действий.
Новая система помогает роботу выполняют различные бытовые задачи, создавая мост между восприятием команд и выполнением. Она состоит из двух частей: модуля Latent Planner, изучающего общие шаблоны действий из различных источников, включая действия человека, и Action Expert, обучающего гуманоида на более чем миллионе реальных видеодемонстраций действий роботов.

Все действия GO-1 основаны на трех основных алгоритмах:
- Система интерпретирует сцену, анализируя сигналы силы, изображения и вербальные входы.
- Latent Planner генерирует структурированный план, прогнозируя последовательности действий.
- Action Expert преобразует эти прогнозы в точные, практические движения.
Робот от AgiBot использует передовой ИИ для воспроизведения точных последовательностей действий, используя технику шумоподавления, которая делает его движения плавными и точными.

В тестах по пяти задачам GO-1 превзошел самые современные модели, улучшив показатели успешности с 46 до 78 %. Его способность учиться как на человеческих, так и на роботизированных данных позволяет ему адаптироваться к новым задачам и постоянно совершенствоваться в реальных сценариях.

На видео видно, как робот ловко управляется с напитками, варит кофе, готовит тосты, ставит цветы в вазу и переносит мебель. Пока все действия гуманоида координируется оператором, но в планах компании создать абсолютно автономное устройство, способное самостоятельно принимать решения.
Читайте также нашу статью о том, как роботы вместе разбирают продуктовую корзину.
Источник