1/ O Google DeepMind está a trazer a IA para o mundo físico: o Gemini Robotics 1.5 transforma um modelo de linguagem num agente que pode guiar robôs e dominar tarefas complexas passo a passo. Um grande passo na ligação entre pensamento e ação! Vamos analisar isso 🧵:
2/ Os robôs há muito lutam com tarefas do dia a dia: muito rígidos, muito dependentes de comandos exatos, incapazes de se adaptar. Mesmo algo tão simples como "limpar a mesa" era difícil sem contexto e habilidades de planejamento.
Sundar Pichai
Sundar PichaiHá 8 horas
Os novos modelos Gemini Robotics 1.5 permitirão que os robôs raciocinem melhor, planejem com antecedência, utilizem ferramentas digitais como a Pesquisa e transfiram aprendizado de um tipo de robô para outro. Nosso próximo grande passo em direção a robôs de uso geral que são verdadeiramente úteis — você pode ver como o robô raciocina enquanto classifica a roupa no vídeo abaixo.
3/ Gemini Robotics 1.5 funde linguagem, visão e planeamento. Compreende a intenção humana, desenha uma sequência de ações, explica o seu raciocínio—e depois dirige um robô para a executar. Pensar e fazer, finalmente conectados.
4/ Os robôs agora podem adaptar-se a situações reais: desde ajudar em casa até gerir a logística em fábricas. Isto não é apenas automação—é uma interação inteligente com o mundo à nossa volta.
Google DeepMind
Google DeepMindHá 8 horas
Muitas das nossas atividades diárias exigem muitos passos para serem concluídas e podem ser extremamente desafiadoras para os robôs. Imagine perguntar: “Com base na minha localização, consegues classificar estes objetos nos contentores corretos de compostagem, reciclagem e lixo?” 🗑️ O robô tem que pesquisar na web as diretrizes locais, olhar para os objetos, descobrir como classificá-los e, em seguida, completar a tarefa. ↓
4,69K