Google DeepMind оголосила про випуск нової мовної моделі Gemini Robotics On-Device, здатної керувати роботами без необхідності в хмарному підключенні. Це означає, що роботи зможуть виконувати складні дії автономно, без з’єднання з Інтернетом, реагуючи на інструкції у природній мові.
Модель стала продовженням попередньої Gemini Robotics, яка дебютувала в березні 2025 року. На відміну від неї, нова версія оптимізована для роботи безпосередньо на пристрої, що дає змогу роботам працювати в режимі реального часу та в умовах, де відсутній доступ до мережі.
На демонстраціях Google показала, як роботи з новою моделлю розпаковують сумки та складають одяг — усе це виконується автономно, без онлайн-підключення. За заявою компанії, хоч модель і була початково навчена для роботів серії ALOHA, вона легко адаптувалася до дворукого робота Franka FR3 та гуманоїдного робота Apollo від Apptronik.
Зокрема, Franka FR3 успішно справлявся із завданнями, які не були йому попередньо продемонстровані, наприклад, збиранням деталей на промисловому конвеєрі. Це свідчить про здатність моделі до генералізації — вона може застосовувати набуті знання в нових ситуаціях.
У бенчмарках Google стверджує, що локальна версія працює майже на рівні хмарної та перевершує інші локальні моделі, хоча конкретні порівняння не були наведені.
Разом із моделлю компанія представила Gemini Robotics SDK — набір інструментів для розробників, який дозволяє навчати роботів новим задачам за допомогою 50–100 демонстрацій. Тренування відбувається у фізичному симуляторі MuJoCo, добре відомому в робототехнічному середовищі.
Розробка Google є частиною ширшої тенденції інтеграції великих мовних моделей у робототехніку. Інші гравці також активно працюють у цьому напрямку:
- Nvidia створює платформу для побудови базових моделей для гуманоїдів;
- Hugging Face розробляє відкриті моделі та датасети для робототехніки, а також займається створенням власних роботів;
- Південнокорейський стартап RLWRLD, за підтримки Mirae Asset, також працює над фундаментальними моделями для роботів.
Схоже наше дивування можливостями мовних моделей скоро вийде за межі написаних ними текстів, намальованих зображень та створених відео. Роботи – ось що буде дивувати нас вже найближчим часом.
Підписуйтесь на розсилку "Цікаві статті"
Кожної пʼятниці ми надсилатимемо вам нові цікаві статті за тиждень у вашу поштову скриньку. Відписатися можна будь-коли. Наш контент на 100% безплатний.