🚀Představujeme Code Arena: novou generaci hodnocení živého kódování pro hraniční modely umělé inteligence. Vytvořeno pro testování toho, jak modely krok za krokem plánují, generují, ladí a vytvářejí skutečné webové aplikace.
Vyzkoušejte Claude, GPT-5, GLM-4.6 a Gemini v Code Arena ještě dnes!
🚨 Aktualizace žebříčku pro úpravu obrázků!
Reve Edit Fast od @reve je nyní veřejně vydána... a pronikl do Top 5!
Komunita Areny je ohromena. Nejenže je rychlejší než Reve Edit, ale je také 5× nákladově efektivnější.
Gratulujeme týmu @reve k tomuto vydání! 👏
🚀 Představujeme Arena Expert: nový vyhodnocovací rámec LMArena pro identifikaci nejnáročnějších výzev na expertní úrovni od skutečných uživatelů, který pohání nový žebříček Expert.
Představujeme také profesní kategorie, které jsou základem osmi nových žebříčků:
💻 Software & IT služby
✍️ Psaní, literatura a jazyk
🔬 Život, fyzika a společenské vědy
🎭 Zábava, sport a média
📈 Obchod, management a finanční operace
🧮 Matematický
⚖️ Právní a státní správa
🩺 Medicína a zdravotnictví
Prozkoumání výkonu modelů napříč poli ve vlákně 🧵 👇