انتهى البيع العام ل PUMP ، في الأصل كنت أيضا مبلغا كبيرا على Bybit ، وتم وضع 1/2 فقط على السلسلة ، وفي النهاية ، نجحت السلسلة فقط ، ولكن لحسن الحظ لم يكن هناك تحوط مقدما ... في الآونة الأخيرة ، كان العديد من الأشخاص في مجتمع الذكاء الاصطناعي يناقشون VLA (الرؤية - اللغة - العمل). لقد بحثت على وجه التحديد فيما إذا كان أي شخص يقوم بمشاريع متعلقة ب VLA على السلسلة ، ورأيت هذا المشروع CodecFlow@Codecopenflow واشتريت القليل. == ماذا يفعل CodecFlow == مقدمة موجزة عن VLA ، VLA هي بنية نموذجية تسمح الذكاء الاصطناعي ليس فقط "بالتحدث" ولكن "العمل". يمكن لLLMs التقليدية (مثل GPT) فهم اللغة وتقديم الاقتراحات فقط ، لكنها لا تستطيع فعل أي شيء أو النقر على الشاشات أو الاستيلاء على الأشياء. يعني نموذج VLA أنه يدمج ثلاث قدرات رئيسية: 1. الرؤية: فهم الصور أو لقطات الشاشة أو مدخلات الكاميرا أو بيانات المستشعر 2. اللغة: فهم تعليمات اللغة الطبيعية من البشر 3. الإجراء: قم بإنشاء تعليمات قابلة للتنفيذ مثل نقرات الماوس ومدخلات لوحة المفاتيح والتحكم في الأذرع الروبوتية يقوم CodecFlow بعمل VLA على السلسلة ، ويمكن أيضا أن تكون جميع العمليات على السلسلة وقابلة للتدقيق والتحقق منها وقابلة للتسوية. ببساطة ، إنها البنية التحتية ل "روبوتات الذكاء الاصطناعي". == لماذا أوليت اهتماما خاصا لهذا المشروع؟ == لقد وجدت أن مطوريهم هم المساهمون الأساسيون في LeRobot ، وهو المشروع مفتوح المصدر الأكثر سخونة في مساحة VLA! LeRobot هي القاعدة العليا لبناء نماذج VLA في عالم المصادر المفتوحة ، بما في ذلك VLA خفيفة الوزن مثل SmolVLA التي يمكن تشغيلها على أجهزة الكمبيوتر المحمولة. هذا يعني أن هذا الفريق يفهم حقا بنية VlA ويفهم الروبوتات. أرى أنهم يواصلون البناء أيضا ، كما أن سعر العملة يرتفع بشكل مطرد ، وأنا متفائل جدا بشأن مسار VLA ، ومن الاتجاه العام ، فإن VLA والروبوتات هي بالفعل المستقبل في السوق. • عمالقة Web2 (Google و Meta و Tesla) ملتزمون حاليا تماما بتدريب VLA والروبوتات. • هناك عدد قليل جدا من مشاريع Web3 التي يمكنها تنفيذ تطبيقات VLA ، ولا تزال نادرة جدا • لدى VLA الفرصة للعب قيمة كبيرة في سيناريوهات مثل DePIN ، وأتمتة الويب ، وتنفيذ عامل الذكاء الاصطناعي على السلسلة ، وما إلى ذلك. CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump دائما DYOR。
CodecFlow
CodecFlow‏26 يونيو 2025
ما هو مشغل $CODEC؟ إنه المكان الذي تجعل فيه نماذج الرؤية واللغة والعمل الذكاء الاصطناعي مفيدا للعمل الحقيقي. المشغل هو وكيل برمجيات مستقل مدعوم بنماذج VLA التي تؤدي المهام من خلال دورة مستمرة للإدراك والعقل والفعل. يمكن لطلاب القانون التفكير والتحدث ببراعة ، لكن لا يمكنهم الإشارة أو النقر أو الاستيلاء على أي شيء. إنها محركات تفكير بحتة بدون أساس في العالم المادي. تجمع VLAs بين الإدراك البصري وفهم اللغة وإخراج العمل المنظم في تمريرة أمامية واحدة. بينما يصف LLM ما يجب أن يحدث ، فإن نموذج VLA يحقق ذلك بالفعل عن طريق إصدار الإحداثيات وإشارات التحكم والأوامر القابلة للتنفيذ. سير عمل المشغل هو: - الإدراك: يلتقط لقطات شاشة أو موجزات الكاميرا أو بيانات المستشعر. - التفكير: يعالج الملاحظات جنبا إلى جنب مع تعليمات اللغة الطبيعية باستخدام نموذج VLA. - الإجراء: ينفذ القرارات من خلال تفاعلات واجهة المستخدم أو التحكم في الأجهزة - كل ذلك في حلقة واحدة مستمرة. أمثلة: LLM مقابل المشغل المدعوم من طراز VLA جدولة اجتماع LLM: يقدم شرحا مفصلا لإدارة التقويم ، ويحدد خطوات جدولة الاجتماع. المشغل مع طراز VLA: - يلتقط سطح مكتب المستخدم. - يحدد تطبيق التقويم (على سبيل المثال ، Outlook ، تقويم Google). - الانتقال إلى الخميس، وإنشاء اجتماع في الساعة 2 ظهرا، وإضافة الحضور. - يتكيف تلقائيا مع تغييرات واجهة المستخدم. الروبوتات: فرز الكائنات LLM: يولد تعليمات مكتوبة دقيقة لفرز الكائنات، مثل تحديد المكونات الحمراء وتنظيمها. المشغل مع طراز VLA: - يراقب مساحة العمل في الوقت الفعلي. - يحدد المكونات الحمراء بين الكائنات المختلطة. - يخطط لمسارات خالية من الاصطدام لذراع آلية. - ينفذ عمليات الانتقاء والمكان ، والتكيف ديناميكيا مع المواضع والتوجهات الجديدة. تعمل نماذج VLA أخيرا على سد الفجوة بين الذكاء الاصطناعي التي يمكن أن تفكر في العالم الذكاء الاصطناعي التي يمكن أن تغيره بالفعل. إنها التي تحول الأتمتة من اتباع القواعد الهشة إلى عمال أذكياء يتكيفون. "تنكسر البرامج النصية التقليدية عندما تتغير البيئة، لكن العملاء يستخدمون الفهم المرئي للتكيف في الوقت الفعلي، والتعامل مع الاستثناءات بدلا من التعطل عليها."
‏‎11.2‏K