Vyrábíme roboty, kteří jsou ve fyzickém světě schopnější než kdy dříve. 🤖 Gemini Robotics 1.5 je vylepšený agentní systém, který dokáže lépe uvažovat, plánovat dopředu, používat digitální nástroje, jako je @Google Search, komunikovat s lidmi a mnoho dalšího. Zde je návod, jak to funguje 🧵
Mnoho našich každodenních činností vyžaduje mnoho kroků a pro roboty mohou být extrémně náročné. Představte si, že se zeptáte: "Dokážete na základě mé polohy roztřídit tyto objekty do správného kompostu, recyklace a odpadkových košů?" 🗑️ Robot musí na webu vyhledat místní pokyny, podívat se na objekty, zjistit, jak je roztřídit, a poté úkol dokončit. ↓
Aby bylo možné tyto požadavky vyřešit, může Gemini Robotics 1.5 pohánět nové agentické aplikace se dvěma klíčovými modely umělé inteligence, které spolupracují: 🔹Gemini Robotics-ER 1.5: Funguje jako mozek na vysoké úrovni, který komunikuje s lidmi, rozumí svému prostředí, organizuje nástroje a vytváří podrobný plán provedení úkolu. 🔹Gemini Robotics 1.5: Ten je zodpovědný za provádění, překládání pokynů do přesných motorických příkazů potřebných k tomu, aby se robot pohyboval a choval obecně.
Gemini Robotics-ER 1.5 je první model myšlení optimalizovaný pro ztělesněné uvažování a dosahuje nejmodernějšího výkonu v akademických a interních benchmarcích. 🧠 Jeho porozumění reálnému světu z něj činí dokonalý orchestrátor pro roboty na vysoké úrovni. Podívejte se, jak si poradí s organizací rušného pracovního stolu ↓
Modely VLA tradičně překládají pokyny přímo do robotického pohybu. 🦾 Gemini Robotics 1.5 nyní dokáže přemýšlet, než začne jednat, a pomocí přirozeného jazyka generuje vnitřní sekvenci uvažování. Díky tomu jsou akce robota lépe interpretovatelné a odemykají užitečnější úkoly - jako je uspořádání prádla podle barvy. ↓
Co se stane, když robotovi řeknete, aby "sbalil kufr na cestu do Londýna"? 🧳 Dokáže si vyhledat počasí, přemýšlet o tom, co si zabalit, kam to sehnat a jak to zabalit. V tomto procesu může model rozložit dlouhé úlohy na jednodušší a přizpůsobit se změnám ve svém prostředí. ↓
Roboti přicházejí ve všech tvarech a velikostech, s různými tvary, snímáním a stupni volnosti. 💡 Gemini Robotics 1.5 se může učit napříč různými provedeními a může přenášet znalosti získané z jednoho robota na druhého, aniž by se musel specializovat.
Nyní se posouváme za hranice modelů, které reagují na jednotlivé instrukce, a vytváříme systémy, které mohou skutečně řešit problémy obecným způsobem - na cestě k řešení AGI ve fyzickém světě. Vývojáři nyní mohou používat Gemini Robotics-ER 1.5 prostřednictvím rozhraní Gemini API v @GoogleAIStudio. Zjistěte více →
318,66K