قد لا تبدو أهمية SDK المستندة إلى السحابة للروبوتات براقة ، ولكنها ضرورية للغاية للنهوض بالقطاع. إذا كنت في دوائر تقنية ، فستسمع عن المنصات السحابية يوميا ، والتي نادرا ما تثير الخيال. ومع ذلك ، بالنسبة للروبوتات والمشغلين البشريين في العالم المادي ، تعد مجموعة أدوات المحاكاة السحابية ضرورة أساسية لأي مطور يحاول توسيع نطاق تدريبه. تعد عمليات محاكاة العالم الافتراضي الدقيقة واحدة من أعلى السلع المرغوبة في مجال الروبوتات في الوقت الحالي. يجري الباحثون تجارب لا نهاية لها لتحديد مجموعات البيانات الحقيقية والتركيبية التي تولد النتائج الأكثر دقة لمهام التدريب نعم ، تتمتع شركات مثل Tesla ببداية هائلة بفضل بيانات الشبكة العصبية التي جمعوها من أساطيلها ، على الرغم من أن هذه البيانات هي مجرد معلومات أولية حتى يتم وضعها موضع التنفيذ من خلال محاكاة تدريب واقعية. بالنسبة لأي شخص آخر ، فإن الحصول على هذا المستوى من البيانات أو حتى الأجهزة اللازمة لتشغيلها ليس خيارا إلا إذا كنت شركة ممولة على نطاق واسع. هذا هو المكان الذي تأتي فيه محاكاة السحابة. من خلال نقل تدريب الروبوت واختباره إلى البيئات الافتراضية المستندة إلى السحابة ، يمكن لأي شخص الوصول إلى الحوسبة والتوسع المطلوبين. يمكن للمنصة السحابية أن تجعل مشاركة عمليات المحاكاة والنتائج والبيانات مركزية. أنت تقوم بشكل أساسي بإزالة الوصول إلى الباب المغلق الذي يمكن لهذه الشركات بمليارات الدولارات الوصول إليه ، ومكونات الأجهزة الشاملة المستخدمة في المختبرات وجلب مجموعات البيانات إلى الضوء العام حيث تصبح مساهمات المصدر المفتوح عبارة عن + EV للابتكار. يثبت نموذج العمل هذا نفسه بالفعل من خلال شراكة LeRobot (مبادرة مفتوحة المصدر) من Hugging Face مع Nvidia لربط أطر عملها حتى يتمكن الباحثون من مشاركة النماذج ومجموعات البيانات وبيئات المحاكاة على السحابة. الهدف النهائي هو إنشاء دولاب الموازنة للبيانات ، حيث يساهم الأشخاص في بيانات المحاكاة والسياسات المدربة لفتح المستودعات ، فإنه يسرع تقدم الآخرين ، وبالتالي يولد بيانات يمكن الوصول إليها عالميا. يتم توجيه الكثير من العمل إلى هذا من خلال سد فجوة "sim to real". غالبا ما كانت أجهزة المحاكاة أقل من الواقع ، حيث تتعلم الروبوتات السلوكيات في عالم افتراضي لم تنتقل إلى العالم الحقيقي ، لأن الفيزياء أو المرئيات لم تكن دقيقة بما فيه الكفاية. هذه الفجوة تغلق الآن بسرعة بسبب دقة المحاكاة الأفضل وأساليب التدريب الهجين. تستخدم معظم أحدث نماذج التأسيس في مجال الروبوتات (مثل Isaac GROOT من NVIDIA و Helix VLA من Figure) بنية نظام مزدوج تحاكي الإدراك البشري. الأمر نفسه ينطبق على كيفية تدريب البيانات في لعبة sims العالمية. يتم تدريب جزء واحد من النموذج على بيانات العرض التوضيحي البشري من العالم الحقيقي ، بينما يتم تدريب جزء آخر على كمية هائلة من البيانات التركيبية التي تم إنشاؤها عبر أجهزة محاكاة عالية الدقة. من خلال الجمع بين التدريب البدني والمحاكاة ، يتعلم النموذج مهارات دقيقة تعمم بشكل أفضل. توفر البيانات الحقيقية الحقيقة في الذكاء الاصطناعي ، بينما توفر البيانات المحاكاة النطاق والتنوع غير العملي لجمعهما في العالم المادي. يمكن للمطورين حتى ضبط نماذج القطارات أو نشرها ببيانات حقيقية أو تركيبية إضافية لمهام محددة ، مما يجعل خط أنابيب التدريب مرنا للغاية. الأشكال Helix VLA التي تستخدم نهج System 1 / System 2 يتم تدريبها على مئات الساعات التي تعمل عن بعد فقط (معززة بالمحاكاة ووضع العلامات الذكية) ، يمكن ل Helix التعامل مع المهام المنزلية الجديدة من خلال اللغة الطبيعية بدون تشفير مخصص. يوضح كيف أن النماذج متعددة الوسائط والتدريب الاصطناعي تقلل من احتياجات البيانات بشكل كبير. @codecopenflow تطبق نفس المبدأ مع Octo ، وهو VLA مفتوح مدمج في Optr SDK الخاص به ، مما يتيح إدراك الكاميرات المتعددة والتحكم الموجه باللغة مع مجموعات بيانات أصغر بكثير وحساب أقل. ...