V posledních několika dnech jsem měl pocit, že likvidita první úrovně je mnohem horší než dříve Ať už se jedná o 2 fáze nebo vnitřní hru, je mnohem těžší hrát... Výkonnost ceny měny kodek je však stále velmi stabilní na 30 milionech a stále mám v ruce nějaké pozice, což je také velmi uklidňující, hlavně proto, že robotická stopa byla na web2 v poslední době opravdu horká a níže jsou také některé nedávné informace, které všechny vyjadřují, že AI je další na řadě Robot Meta. Nedávno Remi Cadene, hlavní výzkumný vědec v Hugging Face, jedná o získání asi 40 milionů dolarů v počátečním financování pro svůj pařížský robotický startup "Uma". • Takové společnosti zabývající se výzkumem a vývojem robotiky jsou investory upřednostňovány a globální získávání finančních prostředků na robotiku v roce 2025 přesáhlo 160 miliard dolarů a přiblížilo se rozsahu 172 miliard dolarů za celý loňský rok. Ohledně Codecu jsem stále optimistický, koneckonců, vývoj Codecu je velmi důležitým přispěvatelem k open source VLA a v současné době je to web3, takže robotickou stopu rozhodně znám velmi dobře. V poslední době jsem byl zaneprázdněn řešením rodinných záležitostí, ale stále se snažím každý den vydělat trochu aktiv a pokračuji v ATH kousek po kousku, WLFI je příliš málo, ale tentokrát nejsem příliš úzkostlivý a se stabilní mentalitou si mohu každý den vydělat trochu uspokojení. BTW, rychle jsem Vibe web pro denní statistiky aktiv, osobně si myslím, že je to velmi užitečné, vložte do komentáře odkaz na Github, stáhněte si jej přímo do počítače, abyste otevřeli indexovou webovou stránku a mohli ji používat.
CodecFlow
CodecFlow22. 8. 18:03
VLA jsou stále velmi nové a pro mnoho lidí je obtížné pochopit rozdíl mezi VLA a LLM. Zde je hluboký ponor do toho, jak se tyto systémy umělé inteligence liší v uvažování, snímání a jednání. Část 1. Pojďme si rozebrat klíčové rozdíly a to, jak se agenti AI obalení kolem LLM liší od operátorských agentů, kteří používají modely VLA: 1. Smysl: Jak vnímají svět Agent (LLM): Zpracovává textová nebo strukturovaná data, např. JSON, API a někdy i obrázky. Je to jako mozek pracující s čistými, abstrahovanými vstupy. Představte si čtení manuálu nebo analýzu tabulky. Skvělé pro strukturovaná prostředí, ale omezené tím, co je do něj přiváděno. Operátor (VLA): Vidí nezpracované pixely z kamer v reálném čase a data ze senzorů (např. dotyk, polohu) a propriocepci (sebeuvědomění si pohybu). Je to jako pohybovat se ve světě očima a smysly, prosperovat v dynamických, chaotických prostředích, jako jsou uživatelská rozhraní nebo fyzické prostory. 2. Jednejte: Jak se vzájemně ovlivňují Agent: Působí voláním funkcí, nástrojů nebo rozhraní API. Představte si to, jako by manažer posílal přesné pokyny jako "rezervujte si let přes Expedia API". Je to záměrné, ale spoléhá se na předem připravené nástroje a jasná rozhraní. Operátor: Provádí nepřetržité nízkoúrovňové akce, jako je pohyb kurzoru myši, psaní na klávesnici nebo ovládání kloubů robota. Je to jako kvalifikovaný pracovník, který přímo manipuluje s prostředím, což je ideální pro úkoly vyžadující přesnost v reálném čase. 3. Kontrola: Jak se rozhodují Agent: Sleduje pomalou, reflexivní smyčku: plánovat, volat nástroj, vyhodnocovat výsledek, opakovat. Je vázán na token (omezený zpracováním textu) a síťový (čeká na odpovědi API). Díky tomu je metodický, ale pomalý pro úkoly v reálném čase. Operátor: Pracuje a činí postupná rozhodnutí v těsné smyčce zpětné vazby. Představte si to jako hráče, který okamžitě reaguje na to, co je na obrazovce. Tato rychlost umožňuje interakci tekutin, ale vyžaduje robustní zpracování v reálném čase. 4. Data k učení: Co pohání jejich školení Agent: Trénován na rozsáhlých textových korpusech, instrukcích, dokumentaci nebo datových sadách RAG (Retrieval-Augmented Generation). Učí se z knih, kódu nebo často kladených dotazů a vyniká v uvažování před strukturovanými znalostmi. Operátor: Učí se z demonstrací (např. videí lidí plnících úkoly), záznamů o teleoperaci nebo signálů odměn. Je to jako učení se sledováním a procvičováním, ideální pro úkoly, kde je nedostatek explicitních pokynů. 5. Způsoby selhání: Kde se lámou Agent: Náchylný k halucinacím (vymýšlení odpovědí) nebo křehkým dlouhodobým plánům, které se rozpadnou, pokud jeden krok selže. Je to jako stratég, který příliš přemýšlí nebo špatně interpretuje situaci. Operátor: Čelí kovariátnímu posunu (když trénovací data neodpovídají reálným podmínkám) nebo složeným chybám v řízení (malé chyby se nabalují jako sněhová koule). Je to jako když řidič ztratí kontrolu nad vozem na neznámé silnici. 6. Infra: Technologie za nimi Agent: Spoléhá na výzvu/směrovač, který rozhoduje, které nástroje volat, registr nástrojů pro dostupné funkce a paměť/RAG pro kontext. Je to modulární nastavení, jako velitelské centrum orchestrující úkoly. Operátor: Potřebuje kanály pro příjem videa, akční server pro řízení v reálném čase, bezpečnostní štít pro prevenci škodlivých akcí a vyrovnávací paměť pro přehrávání pro ukládání zážitků. Jedná se o vysoce výkonný systém vytvořený pro dynamická prostředí. 7. Kde každý září: Jejich sladká místa Agent: Dominuje v pracovních postupech s čistými rozhraními API (např. automatizace obchodních procesů), uvažování nad dokumenty (např. shrnutí zpráv) nebo generování kódu. Je to vaše volba pro strukturované úkoly na vysoké úrovni. Operátor: Vyniká v chaotickém prostředí bez API, jako je navigace v neohrabaných uživatelských rozhraních, ovládání robotů nebo řešení úkolů podobných hrám. Pokud zahrnuje interakci s nepředvídatelnými systémy v reálném čase, VLA je králem. 8. Mentální model: Plánovač + Činitel Představte si LLM Agenta jako plánovače: rozděluje složité úkoly do jasných, logických cílů. Operátor VLA je tím, kdo tyto cíle realizuje přímou interakcí s pixely nebo fyzickými systémy. Kontrolor (jiný systém nebo agent) sleduje výsledky, aby zajistil úspěch. $CODEC
40,94K