1/ Google DeepMind は AI を物理世界にもたらします: Gemini Robotics 1.5 は、言語モデルをロボットをガイドし、複雑なタスクを段階的に習得できるエージェントに変えます。思考と行動をつなぐ大きな一歩! 分解🧵してみましょう:
2/ ロボットは長い間、日常業務に苦労してきました:硬直しすぎ、正確なコマンドに依存しすぎ、適応できない。「テーブルを片付ける」という単純なことでさえ、コンテキストと計画スキルがなければ困難でした。
Sundar Pichai
Sundar Pichai8時間前
新しい Gemini Robotics 1.5 モデルにより、ロボットはより優れた推論、事前計画、検索などのデジタル ツールの使用、ある種類のロボットから別の種類のロボットへの学習の移行が可能になります。本当に役立つ汎用ロボットへの次の大きな一歩は、下のビデオでロボットが洗濯物を仕分けるときにどのように推論するかを見ることができます。
3/ Gemini Robotics 1.5 は、言語、ビジョン、計画を融合します。人間の意図を理解し、一連のアクションを設計し、その推論を説明し、ロボットにそれを実行するように指示します。考えて行動し、ついにつながった。
4/ ロボットは、家庭での手伝いから工場での物流管理まで、実際の状況に適応できるようになりました。これは単なる自動化ではなく、私たちを取り巻く世界とのインテリジェントな相互作用です。
Google DeepMind
Google DeepMind8時間前
私たちの日常活動の多くは、完了するまでに多くのステップを要し、ロボットにとって非常に困難な場合があります。「私の現在地に基づいて、これらのオブジェクトを正しい堆肥箱、リサイクル箱、ゴミ箱に分類できますか?」と尋ねることを想像してみてください。 🗑️ ロボットは、Webで地域のガイドラインを検索し、オブジェクトを見て、それらを分類する方法を理解してから、タスクを完了する必要があります。↓
4.69K