跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+8.06%
USELESS
+0.84%
IKUN
-0.86%
gib
+1.04%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-2.02%
ALON
+5.07%
LAUNCHCOIN
-11.77%
GOONC
-9.82%
KLED
-3.15%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.02%
Boopa
+3.07%
PORK
0.00%
主頁
lmarena.ai
LMArena:社群驅動的 AI 基準測試開放平台。畢業於加州大學柏克萊分校/lmsysorg。我們正在招聘:https://t.co/1OkfLq1Pba
查看原文
lmarena.ai
1月16日 01:14
誰才是真正的 AI 競賽領導者?這取決於你查看哪個排行榜。 在 Arena 的文本排行榜上(自 2023 年 5 月起): 🔹@OpenAI 74% 的時間領先 🔹@GoogleDeepMind 21% 🔹@AnthropicAI 5% 但如果聚焦於專家提示(約 5% 的最困難的現實任務),故事就翻轉了。👇 在 Arena 的專家文本排行榜上(自 2024 年 3 月起): 🔸@AnthropicAI 48% 的時間領先 🔸@OpenAI 37% 🔸@GoogleDeepMind 12% 🔸@Deepseek_AI 4% 重點:不同的任務,不同的贏家。
63
lmarena.ai
1月15日 07:31
🚨突發消息:百度的 ERNIE-5.0-0110 在文本競技場中以 1460 的分數排名第 8。 ERNIE-5.0-0110 首次進入文本排行榜前 10 名,現在是這個組別中唯一來自中國實驗室的模型。 更多亮點: 🧮 #2 數學 🤓 #12 專家,編程 創意寫作、遵循指令的前 20 名 職業類別前 10 名: 🔬 生命、物理與社會科學 📈 商業、管理與金融運營 🩺 醫學與健康照護 恭喜百度的 @ernieforDevs 達成這一里程碑時刻!👏
ERNIE for Developers
1月15日 06:59
🚀介紹 ERNIE-5.0-0110 我們很高興地宣布 ERNIE-5.0-0110 的發布,現在在 @arena 文本排行榜中排名第 8。 主要亮點: 🧮頂級數學表現 💻強大的專家和編程能力 ✍️在創意寫作和指令跟隨方面的競爭性結果 🎓在多個職業類別中排名前 10,包括科學、商業與金融,以及醫療與健康護理 試試看👉 注意到 ERNIE 5.0 不再處於預覽狀態了嗎?👀 更多內容即將推出。
91
lmarena.ai
1月10日 04:13
📊 在排名第1之後,模型排名如何隨時間演變? 我們分析了自2023年中以來的每一位頂尖表現者,當時@OpenAI的GPT‑4位居排行榜首位。截至今天,領先者似乎平均僅在第1名的位置上停留35天。領先模型通常在5個月內掉出前5名,在7個月內掉出前10名。之前的領導者已經大幅下滑,o1現在排名第56,Claude 3 Opus排名第139,隨著進步越來越快。我們拭目以待2026年會帶來什麼。
198
熱門
排行
收藏