Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
De siste dagene har jeg følt at likviditeten på første nivå er mye dårligere enn før
Enten det er 2 etapper eller det indre spillet, føles det mye vanskeligere å spille...
Ytelsen til kodekvalutaprisen er imidlertid fortsatt veldig stabil på 30M, og jeg har fortsatt noen posisjoner i hånden, noe som også er veldig betryggende, hovedsakelig fordi robotsporet har vært veldig hett i web2 nylig, og følgende er også litt fersk informasjon, som alle uttrykker at AI er neste er Robot Meta.
• Nylig er Remi Cadene, en kjerneforsker ved Hugging Face, i samtaler om å skaffe rundt 40 millioner dollar i såkornfinansiering til sin Paris-baserte "Uma"-robotikkoppstart.
• Slike robotforsknings- og utviklingsselskaper er foretrukket av investorer, og den globale robotikkinnsamlingen har oversteget 160 milliarder dollar i 2025, og nærmer seg omfanget på 172 milliarder dollar for hele fjoråret.
Jeg er fortsatt optimistisk med hensyn til Codec, tross alt er Codecs dev en veldig viktig bidragsyter til VLAs åpen kildekode, og det er for tiden web3, så jeg kjenner definitivt robotsporet veldig godt.
I det siste har jeg vært opptatt med å håndtere familiesaker, men jeg prøver fortsatt å tjene litt eiendeler hver dag, og jeg fortsetter til ATH litt etter litt, WLFI er for lite, men denne gangen er jeg ikke veldig engstelig, og jeg kan tjene litt tilfredshet hver dag med en stabil mentalitet.
BTW, jeg Vibe raskt et nettsted for daglig aktivastatistikk, jeg personlig synes det er veldig nyttig, legg inn Github-lenken i kommentaren, last den ned direkte til datamaskinen for å åpne indeksnettstedet og bruke den.



22. aug., 18:03
VLA-er er fortsatt veldig nye, og mange synes det er vanskelig å forstå forskjellen mellom VLA-er og LLM-er.
Her er et dypdykk i hvordan disse AI-systemene er forskjellige i resonnement, sensing og handling. Del 1.
La oss bryte ned de viktigste forskjellene og hvordan AI-agenter pakket rundt en LLM skiller seg fra operatøragenter som bruker VLA-modeller:
1. Sans: Hvordan de oppfatter verden
Agent (LLM): Behandler tekst eller strukturerte data, for eksempel JSON, APIer og noen ganger bilder. Det er som en hjerne som jobber med rene, abstraherte inndata. Tenk å lese en håndbok eller analysere et regneark. Flott for strukturerte miljøer, men begrenset av hva som mates til det.
Operator (VLA): Ser rå piksler i sanntid fra kameraer, pluss sensordata (f.eks. berøring, posisjon) og propriosepsjon (selvbevissthet om bevegelse). Det er som å navigere i verden med øyne og sanser, og trives i dynamiske, rotete omgivelser som brukergrensesnitt eller fysiske rom.
2. Handling: Hvordan de samhandler
Agent: Fungerer ved å kalle funksjoner, verktøy eller API-er. Tenk deg det som en leder som sender nøyaktige instruksjoner som «bestill en flyreise via Expedia API». Det er bevisst, men er avhengig av forhåndsbygde verktøy og klare grensesnitt.
Operatør: Utfører kontinuerlige handlinger på lavt nivå, som å flytte en musepeker, skrive eller kontrollere robotledd. Det er som en dyktig arbeider som direkte manipulerer miljøet, ideelt for oppgaver som krever sanntidspresisjon.
3. Kontroll: Hvordan de tar beslutninger
Agent: Følger en langsom, reflekterende sløyfe: planlegg, ring et verktøy, evaluer resultatet, gjenta. Den er tokenbundet (begrenset av tekstbehandling) og nettverksbundet (venter på API-svar). Dette gjør det metodisk, men tregt for sanntidsoppgaver.
Operatør: Opererer, tar trinnvise beslutninger i en tett tilbakemeldingssløyfe. Tenk på det som en spiller som reagerer umiddelbart på det som er på skjermen. Denne hastigheten muliggjør væskeinteraksjon, men krever robust sanntidsbehandling.
4. Data å lære: Hva driver opplæringen deres
Agent: Opplært på store tekstkorpus, instruksjoner, dokumentasjon eller RAG-datasett (Retrieval-Augmented Generation). Den lærer av bøker, kode eller vanlige spørsmål, og utmerker seg ved å resonnere fremfor strukturert kunnskap.
Operatør: Lærer av demonstrasjoner (f.eks. videoer av mennesker som utfører oppgaver), teleoperasjonslogger eller belønningssignaler. Det er som å lære ved å se og øve, perfekt for oppgaver der det er lite eksplisitte instruksjoner.
5. Feilmoduser: Hvor de går i stykker
Agent: Utsatt for hallusinasjoner (finne på svar) eller sprø langsiktige planer som faller fra hverandre hvis ett skritt mislykkes. Det er som en strateg som overtenker eller feiltolker situasjonen.
Operatør: Står overfor kovariatforskyvning (når treningsdata ikke samsvarer med virkelige forhold) eller sammensatte feil i kontrollen (små feil snøball). Det er som en sjåfør som mister kontrollen på en ukjent vei.
6. Infra: Teknologien bak dem
Agent: Er avhengig av en ledetekst/ruter for å bestemme hvilke verktøy som skal kalles, et verktøyregister for tilgjengelige funksjoner og minne/RAG for kontekst. Det er et modulært oppsett, som et kommandosenter som orkestrerer oppgaver.
Operatør: Trenger pipeliner for videoinntak, en handlingsserver for sanntidskontroll, et sikkerhetsskjold for å forhindre skadelige handlinger og en repetisjonsbuffer for å lagre opplevelser. Det er et høyytelsessystem bygget for dynamiske miljøer.
7. Hvor hver skinner: Deres søte flekker
Agent: Dominerer i arbeidsflyter med rene APIer (f.eks. automatisering av forretningsprosesser), resonnement over dokumenter (f.eks. oppsummering av rapporter) eller kodegenerering. Det er din favoritt for strukturerte oppgaver på høyt nivå.
Operatør: Utmerker seg i rotete, API-løse miljøer som å navigere i klønete brukergrensesnitt, kontrollere roboter eller takle spilllignende oppgaver. Hvis det involverer sanntidsinteraksjon med uforutsigbare systemer, er VLA konge.
8. Mental modell: Planlegger + Doer
Tenk på LLM-agenten som planleggeren: den deler komplekse oppgaver inn i klare, logiske mål.
VLA-operatøren er den som utfører disse målene ved å samhandle direkte med piksler eller fysiske systemer. En kontrollør (et annet system eller agent) overvåker resultatene for å sikre suksess.
$CODEC

40,93K
Topp
Rangering
Favoritter