@GoogleDeepMind の Gemini Robotics 1.5 は、ロボットにエージェント機能が正式に導入され、ロボットが複雑な複数ステップのタスクを完了できるようにします。 だがしかし。。。それはどういう意味ですか。🧐 以前は、ロボットは果物を拾ったり、バッグのジッパーを閉めたりするなど、1 つのタスクを実行できました。現在、私たちは真に推論し、計画し、一般化できるモデルでそれを超えています。たとえば、ロボットに「これらのオブジェクトを正しい堆肥、リサイクル、ゴミ箱に分類できますか?」と尋ねると、ロボットは地域のリサイクルガイドラインを検索し、目の前にあるオブジェクトを理解し、地域のガイドラインに基づいてそれらを分類する方法を考え出すことができます。 Gemini Robotics-ER 1.5 は、身体化された推論に最適化された最初の思考モデルであり、学術ベンチマークと内部ベンチマークの両方で最先端のパフォーマンスを達成しています。 本日より、@GoogleAIStudio のプレビューで利用できるようになります。