Facem roboții mai capabili ca niciodată în lumea fizică. 🤖 Gemini Robotics 1.5 este un sistem agentic care poate raționa mai bine, poate planifica din timp, poate folosi instrumente digitale precum @Google Search, poate interacționa cu oamenii și multe altele. Iată cum funcționează 🧵
Multe dintre activitățile noastre zilnice necesită mulți pași pentru a fi finalizate și pot fi extrem de dificile pentru roboți. Imaginați-vă că întrebați: "În funcție de locația mea, puteți sorta aceste obiecte în coșurile de compost, reciclare și gunoi corecte?" 🗑️ Robotul trebuie să caute pe web linii directoare locale, să se uite la obiecte, să-și dea seama cum să le sorteze și apoi să finalizeze sarcina. ↓
Pentru a răspunde acestor solicitări, Gemini Robotics 1.5 poate alimenta noi aplicații agentice cu două modele cheie de inteligență artificială care lucrează împreună: 🔹Gemini Robotics-ER 1.5: Acesta acționează ca creier de nivel înalt, interacționând cu oamenii, înțelegând mediul său, orchestrând instrumente și creând un plan detaliat pentru a îndeplini o sarcină. 🔹Gemini Robotics 1.5: Acesta este responsabil pentru execuție, transpunând instrucțiunile în comenzi motorii precise necesare pentru ca robotul să se miște și să acționeze într-un mod general.
Gemini Robotics-ER 1.5 este primul model de gândire optimizat pentru raționamentul încorporat și atinge performanțe de ultimă generație pe benchmark-uri academice și interne. 🧠 Înțelegerea sa din lumea reală îl face un orchestrator perfect de nivel înalt pentru roboți. Urmăriți cum abordează organizarea unui birou aglomerat ↓
În mod tradițional, modelele VLA traduc instrucțiunile direct în mișcare robotică. 🦾 Gemini Robotics 1.5 poate acum să gândească înainte de a lua măsuri, generând o secvență internă de raționament folosind limbajul natural. Acest lucru face ca acțiunile robotului să fie mai interpretabile și deblochează sarcini mai utile - cum ar fi organizarea rufelor după culoare. ↓
Ce se întâmplă când îi spui robotului să "împacheteze o valiză pentru călătoria mea la Londra"? 🧳 Poate să se uite la vreme, să se gândească la ce să împacheteze, de unde să-l obțină și cum să-l împacheteze. În acest proces, modelul poate împărți sarcinile lungi în altele mai simple și poate fi adaptabil la schimbările din mediul său. ↓
Roboții vin în toate formele și dimensiunile, cu diferite forme, detectări și grade de libertate. 💡 Gemini Robotics 1.5 poate învăța prin diferite realizări și poate transfera cunoștințele învățate de la un robot la altul fără a fi nevoie să se specializeze.
Acum trecem dincolo de modelele care reacționează la instrucțiuni unice și creăm sisteme care pot aborda cu adevărat problemele într-un mod general - pe calea spre rezolvarea AGI în lumea fizică. Dezvoltatorii pot folosi acum Gemini Robotics-ER 1.5 prin API-ul Gemini în @GoogleAIStudio. Aflați mai multe →
191,02K