Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
PUMP la vendita pubblica è finita, inizialmente avevo investito molto su Bybit, lasciando solo 1/2 sulla catena, alla fine solo quello sulla catena ha avuto successo, per fortuna non ho coperto in anticipo...
A proposito, recentemente nella comunità AI molte persone stanno discutendo di VLA (Vision‑Language‑Action)
Ho fatto una ricerca sui progetti sulla catena per vedere se qualcuno stava lavorando su VLA, e ho visto questo progetto CodecFlow @Codecopenflow, ho comprato un po'.
== Cosa fa il progetto CodecFlow ==
Una breve introduzione a VLA, VLA è un'architettura di modello che consente all'AI non solo di "parlare", ma anche di "fare".
I tradizionali LLM (come GPT) possono solo comprendere il linguaggio e fornire suggerimenti, ma non possono eseguire azioni, non possono cliccare sullo schermo, non possono afferrare oggetti.
Il modello VLA significa integrare tre grandi capacità:
1. Visione: comprendere immagini, screenshot, input della fotocamera o dati dei sensori
2. Linguaggio: comprendere i comandi in linguaggio naturale degli esseri umani
3. Azione: generare comandi eseguibili, come clic del mouse, input da tastiera, controllo di bracci meccanici
CodecFlow sta lavorando su VLA sulla catena, tutti i processi operativi possono essere registrati sulla catena, auditabili, verificabili e liquidabili.
In breve, è l'infrastruttura di base per un "robot AI".
== Perché ho prestato particolare attenzione a questo progetto? ==
Ho scoperto che i loro sviluppatori sono i principali contributori del progetto open source LeRobot, il più popolare nel campo VLA!
LeRobot è la base di alto livello per costruire modelli VLA nel mondo open source, inclusi SmolVLA e altri modelli leggeri che possono funzionare su laptop.
Questo significa che questo team comprende davvero l'architettura VLA e i robot.
Ho visto che continuano a costruire, il prezzo della moneta è anche stabilmente in aumento, io stesso sono molto ottimista sul settore VLA, e guardando la tendenza generale, VLA e i robot sono sicuramente il futuro nel mercato.
• I giganti del Web2 (Google, Meta, Tesla) si sono attualmente impegnati a fondo nella formazione di VLA e robot;
• Ci sono pochi progetti Web3 che possono eseguire applicazioni VLA, e sono molto rari
• VLA ha l'opportunità di esprimere un enorme valore in scenari come DePIN, automazione web, esecuzione di agenti AI sulla catena.
CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
Fai sempre le tue ricerche.

26 giu 2025
Che cos'è un operatore $CODEC?
È qui che i modelli di visione-linguaggio-azione rendono finalmente l'intelligenza artificiale utile per il lavoro reale.
Un operatore è un agente software autonomo alimentato da modelli VLA che esegue attività attraverso un ciclo continuo di percezione-ragione-azione.
Gli LLM possono pensare e parlare brillantemente, ma non possono puntare, cliccare o afferrare nulla. Sono puri motori di ragionamento senza alcun fondamento nel mondo fisico.
I VLA combinano la percezione visiva, la comprensione del linguaggio e l'output di azioni strutturate in un unico passaggio in avanti. Mentre un LLM descrive ciò che dovrebbe accadere, un modello VLA lo fa effettivamente accadere emettendo coordinate, segnali di controllo e comandi eseguibili.
Il flusso di lavoro dell'operatore è:
- Percezione: acquisisce schermate, feed della telecamera o dati del sensore.
- Ragionamento: elabora le osservazioni insieme alle istruzioni in linguaggio naturale utilizzando il modello VLA.
- Azione: esegue le decisioni attraverso le interazioni dell'interfaccia utente o il controllo hardware, il tutto in un unico ciclo continuo.
Esempi: LLM vs. operatore alimentato dal modello VLA
Pianificazione di una riunione
LLM: fornisce una spiegazione dettagliata della gestione del calendario, delineando i passaggi per programmare una riunione.
Operatore con modello VLA:
- Acquisisce il desktop dell'utente.
- Identifica l'applicazione del calendario (ad esempio, Outlook, Google Calendar).
- Passa al giovedì, crea una riunione alle 14:00 e aggiunge i partecipanti.
- Si adatta automaticamente alle modifiche dell'interfaccia utente.
Robotica: smistamento di oggetti
LLM: genera istruzioni scritte precise per l'ordinamento degli oggetti, come l'identificazione e l'organizzazione dei componenti rossi.
Operatore con modello VLA:
- Osserva lo spazio di lavoro in tempo reale.
- Identifica i componenti rossi tra gli oggetti misti.
- Pianifica traiettorie prive di collisioni per un braccio robotico.
- Esegue operazioni di pick-and-place, adattandosi dinamicamente a nuove posizioni e orientamenti.
I modelli VLA colmano finalmente il divario tra l'IA che può ragionare sul mondo e l'IA che può effettivamente cambiarlo. Sono loro che trasformano l'automazione da fragile rispetto delle regole a risoluzione adattiva dei problemi: lavoratori intelligenti.
"Gli script tradizionali si interrompono quando l'ambiente cambia, ma gli operatori utilizzano la comprensione visiva per adattarsi in tempo reale, gestendo le eccezioni invece di bloccarsi".

11,22K
Principali
Ranking
Preferiti