🚀Vi introduserer Code Arena: neste generasjon av live-kodingsevalueringer for grensesprengende AI-modeller. Bygget for å teste hvordan modeller planlegger, stillaser, feilsøker og bygger ekte nettapper trinn for trinn.
Prøv Claude, GPT-5, GLM-4.6 og Gemini i Code Arena i dag!
🚨 Oppdatering av ledertavlen for bilderedigering!
Reve Edit Fast av @reve er nå offentlig utgitt ... og har brutt seg inn på topp 5!
Arena-fellesskapet er imponert. Ikke bare er det raskere enn Reve Edit, men det er 5× mer kostnadseffektivt.
Gratulerer til @reve-teamet med denne utgivelsen! 👏
🚀 Vi introduserer Arena Expert: et nytt LMArena-evalueringsrammeverk for å identifisere de tøffeste spørsmålene på ekspertnivå fra ekte brukere, og driver en ny ekspertledertavle.
Vi introduserer også yrkeskategorier som ligger til grunn for åtte nye ledertavler:
💻 Programvare og IT-tjenester
✍️ Skriving, litteratur og språk
🔬 Livs-, fysikk- og samfunnsvitenskap
🎭 Underholdning, sport og media
📈 Forretnings-, ledelses- og finansoperasjoner
🧮 Matematisk
⚖️ Juridisk og offentlig sektor
🩺 Medisin og helsevesen
Utforsk hvordan modeller presterer på tvers av felt i tråd 🧵 👇