1/ Google DeepMind вводит ИИ в физический мир: Gemini Robotics 1.5 превращает языковую модель в агента, который может управлять роботами и осваивать сложные задачи шаг за шагом. Это важный шаг в связывании мысли и действия! Давайте разберем это 🧵:
2/ Роботы долгое время испытывали трудности с повседневными задачами: слишком жесткие, слишком зависимые от точных команд, неспособные адаптироваться. Даже что-то такое простое, как "убрать со стола", было сложно без контекста и навыков планирования.
Sundar Pichai
Sundar Pichai8 часов назад
Новые модели Gemini Robotics 1.5 позволят роботам лучше рассуждать, планировать, использовать цифровые инструменты, такие как Поиск, и передавать знания от одного типа робота к другому. Наш следующий большой шаг к универсальным роботам, которые действительно полезны — вы можете увидеть, как робот рассуждает, сортируя белье в видео ниже.
3/ Gemini Robotics 1.5 объединяет язык, зрение и планирование. Он понимает человеческие намерения, разрабатывает последовательность действий, объясняет свои рассуждения — а затем направляет робота на их выполнение. Мысли и действия, наконец, связаны.
4/ Роботы теперь могут адаптироваться к реальным ситуациям: от помощи в доме до управления логистикой на фабриках. Это не просто автоматизация — это интеллектуальное взаимодействие с окружающим миром.
Google DeepMind
Google DeepMind8 часов назад
Много наших повседневных действий требует много шагов для завершения и может быть крайне сложным для роботов. Представьте, что вы спрашиваете: "Исходя из моего местоположения, можешь отсортировать эти объекты в правильные контейнеры для компоста, переработки и мусора?" 🗑️ Роботу нужно будет искать в интернете местные рекомендации, посмотреть на объекты, понять, как их отсортировать, а затем выполнить задачу. ↓
4,69K