Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Představujeme MCPMark, spolupráci s @EvalSysOrg a @lobehub!
Vytvořili jsme náročný benchmark pro zátěžové testování používání MCP v komplexním kontextu.
- 127 kvalitních datových vzorků vytvořených odborníky.
- GPT-5 se ujímá aktuálního vedení a dosahuje Pass@1 46,96 %, zatímco ostatní modely spadají do rozmezí 10-30 %.
- Různé testovací případy na Notion, Github, Filesystem, Playwright (prohlížeč) a Postgres.
🧵9 s před

35,91K
Top
Hodnocení
Oblíbené