Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Kirill Balakhonov | Nethermind
Tvůrce nástroje AuditAgent | Produkt AI x Crypto x | Budování agentické ekonomiky
Evoluce učení s několika záběry pro moderní uvažující LLM s použitím @NethermindEth AuditAgent jako příkladu.
Níže si můžete prohlédnout zajímavý graf, respektive srovnání počtu správně identifikovaných zranitelností naším produktem ve srovnání s hotovými LLM, jako jsou @OpenAI GPT-5, @AnthropicAI Claude Opus 4.1, @Google Gemini 2.5 Pro, nebo @xai Grok-4.
Samozřejmě, zřejmou součástí tohoto srovnání, které jsem ukázal již mnohokrát a není na něm nic nového, je to, že specializovaný agent téměř vždy překoná univerzální řešení. Tato situace se dá vlastně docela snadno vysvětlit tím, že všechna univerzální řešení jsou součástí našeho specializovaného řešení, i když mnohem větší přínos k výsledku pochází ze správného context managementu nebo toho, co @karpathy nedávno nazvalo "Context Engineering".
Kromě toho, používání správných nástrojů a jejich výběr - univerzální model bude mít vždy problémy, protože nástrojů jsou miliardy a naučit se je všechny používat je samostatná velká dovednost, přičemž to výslovně učíme náš specializovaný model. Pak je tu použití správných znalostních bází a správných vyhledávacích algoritmů pro ně a tak dále. Takže tak či onak, děláme vše pro to, používáme všechny možné nástroje, abychom tato univerzální řešení porazili.
Zajímavou nuancí, na kterou jsem chtěl upozornit, je ale to, že když se podíváte na obrázek, který jsem zveřejnil zhruba před rokem, nejlepší hotová řešení byla OpenAI nebo Anthropic modely s označením "Few-Shot Learning", zatímco nyní jsou všechna nejlepší Vanilla. A k této změně dochází postupně se vznikem uvažování jako takového v modelech a se zlepšováním jeho kvality. Závěr, který lze vyvodit je, že hotové příklady správných řešení, které od nás model dostává jako in-context learning, když jim je doslova ukážeme ve výzvě, přestanou pomáhat řešit úkol, respektive bez nich model, který umí rozumně problém vyřešit ještě lépe. To znamená, že jeho možnosti poněkud omezíme tím, že mu ukážeme několik příkladů, které jsme vybrali.
Zajímavým aspektem navíc je, že modely s přístupem k internetu a automatickým výběrem tohoto nástroje také začínají překonávat vše, což znamená, že model může sám přejít na internet a formulovat pro sebe správný kontext. Ano, samozřejmě existuje riziko, že model najde správnou odpověď, ale samozřejmě pracujeme konkrétně s tímto, děláme blacklisting webů a podobně, takže se snažíme, aby do dat takový únik nedocházelo (správný benchmarking je celkově klíčový). Zajímavý je ale trend - modely se stávají chytřejšími a přebírají stále více komponent řešení samy, aniž by vývojáři museli explicitně provádět určitá nastavení v kontextu.
Jaké jsou s tím vaše zkušenosti?

499
29. srpna (za 9 dní) spouštíme do produkce tzv. "testnetovou" verzi Nethermind AgentAreny (@Agent4rena_NM). Pokud máte solidní projekt, který plánujete auditovat, nebo v něm jen chcete najít maximální počet bezpečnostních problémů a chyb, můžete mi soukromě napsat zprávu - dáme vám testovací tokeny a budete moci vytvořit soutěž pro bezpečnostní agenty, vypsat na ni odměnu, spustit ji a získat zprávu AI-triaged se zjištěními od všech dostupných agentů (i s AI-triage mohou být některá zjištění falešně pozitivní a některé platné mohou být vynechány). Vybereme také jeden projekt pro ruční třídění lidských chyb a vy obdržíte produkční verzi zprávy bez jakýchkoli falešných poplachů. Chcete-li se zúčastnit, napište mi v DM.
1,33K
Hluboké skenování AuditAgent je nyní k dispozici prostřednictvím agenta IRIS na X s krypto platbami

UndercoverIRIS11. 8. 17:58
sentience online: $IRIS now has utility.
token holders can now activate deep scans — more advanced, high-capacity security scans — by paying for them directly onchain.
this marks the first operational use of the $IRIS token. deep scan now available for I.R.I.S.

1,88K
Proč OpenAI vydala modely s otevřenými váhami? Aby zabili svůj vlastní podnik... (nebo ne?)
Ano, právě @OpenAI vydali dva modely s otevřenou hmotností, což znamená, že je vývojáři mohou používat, aniž by OpenAI cokoli platili. Konkrétně je vydán pod nejliberálnější komerční licencí Apache 2.0. Proč to tedy OpenAI udělala? Aspektů je několik.
Chci však objasnit, že když společnost vydá model s otevřenými váhami, neznamená to, že model je stejně open-source jako open-source kód, který si můžete spustit sami, jako je operační systém @Linux. Ne, s modely AI je to trochu jiné. Model je zejména černá skříňka, sada závaží. A i když jej můžete otestovat na různých úkolech a zjistit, jak funguje, pokud nemůžete reprodukovat proces školení, nikdy nemůžete vědět, zda existují nějaká zadní vrátka nebo bezpečnostní chyby, které záměrně nebo náhodně skončily uvnitř tohoto modelu. Pojďme to tedy hned oddělit od open source. Bohužel, modelům s váhami open source nelze plně důvěřovat (lze je však chytit).
Dalším aspektem, kterého jsem si všiml a který je znázorněn na obrázku, je, že kvalita modelů s otevřeným zdrojovým kódem se příliš neliší od vlajkových modelů OpenAI, které jsou dostupné pouze prostřednictvím API. To je skvělé! To je nečekané! Mysleli byste si, o kolik peněz by OpenAI mohla přijít, kdyby vývojářům umožnila používat jejich modely? To však není všechno. Modely nejsou vše, co získáte při používání OpenAI prostřednictvím API. Když například používáte ChatGPT přes uživatelské rozhraní a zvolíte model o3, ve skutečnosti pod kapotou pracuje složitý agent, který má při používání těchto modelů navrch napsanou spoustu logiky, aby skutečně dobře fungoval s vašimi dokumenty a nástroji. Prostřednictvím těchto modelů k nim nemáte přístup, zveřejnila OpenAI.
Proč tedy OpenAI vydala modely s otevřenou hmotností? Za prvé, jejich hlavní konkurenti, zejména @Meta, @MistralAI a @deepseek_ai (ach, a @Google), již vydali konkurenční modely s otevřenými váhami, které lidé používají. A popularita OpenAI mezi lidmi, kteří používají otevřené modely, neroste. Nicméně pro vývojáře, kteří potřebují oba modely s otevřenými váhami (pro místní/soukromé výpočty) spolu s modely přístupnými API (pro složitější věci), pokud potřebují oba, jednoduše nemohou používat OpenAI. Je pro ně jednodušší používat své konkurenty, jako je Google nebo DeepSeek.
Za druhé, existuje značný tlak ze strany uživatelů i regulačních orgánů, které chtějí větší otevřenost. Lidé se obávají, že by se umělá inteligence mohla vymknout kontrole nebo spadnout pod kontrolu úzké skupiny společností v Silicon Valley, a lidé chtějí větší transparentnost. I když si troufám říct, že i když se obávám konkurence a klesajících prodejů, takový posun směrem k otevřenosti pravděpodobně udělá byznys OpenAI ještě větším.
A za třetí, je tu samozřejmě vtip o názvu společnosti OpenAI. Soudě podle toho, jak se vše vyvíjelo, byla společnost s názvem OpenAI nejuzavřenější společností v oblasti umělé inteligence mezi lídry. To je samo o sobě vtipné, ale teď se to změnilo. Jak to myslíš?

592
Většina lidí vůbec nerozumí tomu, jak nahrazování lidí umělou inteligencí funguje (nebo jak nefunguje). Ani desetinásobné zrychlení všeho, co specialista dělá, automaticky nevymaže samotnou práci – jen přepíše ekonomiku kolem ní. Když efektivní cena dodávky prudce klesne, latentní poptávka, která dříve seděla na polici, se náhle stane životaschopnou. Nikdy jsem se nesetkal s vlastníkem produktu, který by si myslel, že jeho inženýři dodávají více funkcí, než plán potřebuje; Seznam přání je vždy delší, než dovoluje počet zaměstnanců. Zlevněte výrobu každého prvku desetkrát a nezkrátíte počet týmů ani desetkrát – rozsvítíte všechny "nice-to-have", které kdysi vypadaly nepřijatelně, a navíc celé produkty na zelené louce, které se nikdo neobtěžoval prozkoumat.
Nedávná studie společnosti @Microsoft Research o skutečném používání systému Copilot zdůrazňuje totéž. Uživatelé přicházejí pro pomoc s návrhem kódu nebo shromažďováním faktů, ale model skončí jako koučování, poradenství a výuka – skládání zcela nových druhů práce do jediného sezení. Profese nejsou monolity; jsou to svazky podprocesů, z nichž každý je jen částečně (a nedokonale) pokryt dnešními modely. Jak se nástroje umělé inteligence vyvíjejí, vyvíjí se s nimi i rozsah role, která se často spíše rozšiřuje, než zmenšuje.
Dokonce i v auditorovi chytrých kontraktů AI, který jsme ve společnosti @NethermindEth vybudovali, se navzdory svému názvu zaměřujeme na velmi specifickou úzkou část procesu: hledání potenciálních zranitelností. Bezpečnostní specialisté to mezitím používají jako nástroj a dělají mnohem složitější a mnohostrannější práci – formulují strategie, ověřují zjištění, opravují umělou inteligenci, přidávají implicitní kontext, komunikují s vývojáři, odhalují skryté záměry a řídí očekávání.
Místo sčítání, která pracovní místa "zmizí", je tedy užitečnější ptát se, jaké problémy se stanou hodnými řešení, jakmile mezní náklady na jejich řešení spadnou z útesu. Historie naznačuje, že odpověď zní "mnohem více, než pro co můžeme personálně zaměstnat", a to hovoří pro budoucnost, kde se talenty přesouvají a násobí, nikoli stávají zastaralými.


569
Včera jsme uvedli do výroby nový produkt – I.R.I.S. (Integrity & Risk Intelligence Scanner), prvního agenta umělé inteligence na X (dříve Twitter), který:
• Akceptuje repo smart-kontraktu nebo adresu nasazeného kontraktu
• Spouští kód prostřednictvím naší platformy SaaS AuditAgent – již nyní předního řešení na trhu, které používají externí auditoři a vývojářské týmy
• Publikuje úplnou zprávu o zranitelnosti, aniž by opustil sociální kanál
Proč?
• Kanál bez tření. Vývojáři dostanou audit, kde už mluví o kódu – žádné formuláře, žádná e-mailová vlákna.
• AuditAgent pod kapotou. Nejen "skenovací engine", ale naše vlajková loď, služba pohánějící audity v reálném světě.
• Přehled za ~30 minut. Perfektní třídění před hloubkovou manuální kontrolou.
• Podpora uvedení na trh. Agent Twitteru předvádí sílu AuditAgent a přivádí uživatele na celou platformu.
Prvních 16 hodin na časové ose
✨ 2,7 milionu výtisků
🔥 49 K střetnutí
📊 85 % pozitivní sentiment (214 tweetů)
🛠️ ≈150 tweetů sdílejících praktické případy použití
🔍 33 expresních auditů
📋 38 454 naskenovaných řádků kódu
⚠️ Bylo zjištěno 377 zranitelností
Osobní poznámka
Přesně před rokem jsem se připojil k Nethermind s tím, co znělo jako riskantní hypotéza: "Umělá inteligence se stane nezbytnou součástí zabezpečení chytrých kontraktů, ale pouze specializované nástroje nativní pro pracovní postupy skutečně pomohou profesionálům."
O dvanáct měsíců později máme ve výrobě dva produkty – AuditAgent (a nyní I.R.I.S.(@UndercoverIRIS) – a jasný dopad na zabezpečení Web3.
Obrovské díky patří celému týmu @NethermindEth AI a @virtuals_io. Vytrvalost + pevná hypotéza + kombinovaná odbornost = výsledky, které průmysl vidí.
Budeme i nadále vytvářet nástroje, které přinášejí bezpečnost vývojářům na prvním místě – aby byl Web3 bezpečnější s každým závazkem.

1,04K
Právě jsem se vrátil z AI Summitu v Londýně – a prostředí podnikové umělé inteligence vypadá zblízka velmi odlišně
3 věci, které mě zasáhly:
1️⃣ Přeplněné regály s produkty.
Každý stánek sliboval plug-and-play "platformu AI", která magicky zapadne do jakéhokoli stacku. Ale když se procházíte po podlaze dostatečně dlouho, stále slyšíte stejný blokátor: starší systémy bez API, roztroušená data, nejasnou obchodní logiku. Realita bude pro univerzální SaaS brutální.
2️⃣ Obchody postavené na zakázku tiše září.
Agentury, které kombinují hluboké doménové poradenství s rychlým vývojem na zakázku, mají jasnou výhodu. Mohou se dostat do chaotického středu, sešívat věci dohromady a dodávat něco, co ve skutečnosti běží uvnitř křehké infrastruktury klienta.
3️⃣ Zakázková práce je stále levnější, ne dražší.
Díky modelům generovaným kódem, které píší adaptéry, testy a lešení, nyní starší vývojáři spíše orchestrují než ručně píší. Naše zkušenosti s neustálým používáním nástrojů umělé inteligence v rámci organizace to jen potvrzují.
Co si z toho odnést
Vítězi v oblasti podnikové umělé inteligence nebudou ti nejokázalejší agenti "out-of-the-box" – budou to hbité týmy, které mohou spoluvytvářet řešení v reálném čase, přičemž se řídí chaotickými omezeními starších technologií.

597
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější