Cerebras ha dimostrato la sua capacità di ospitare grandi MoE a velocità molto elevate questa settimana, lanciando gli endpoint Qwen3 235B 2507 e Qwen3 Coder 480B a >1.500 token di output/s ➤ @CerebrasSystems ora offre endpoint sia per Qwen3 235B 2507 Reasoning che per Non-reasoning. Entrambi i modelli hanno parametri totali di 235B con 22B attivi. ➤ Qwen 3 235B 2507 Reasoning offre un'intelligenza paragonabile a o4-mini (high) e DeepSeek R1 0528. La variante Non-reasoning offre un'intelligenza paragonabile a Kimi K2 e ben superiore a GPT-4.1 e Llama 4 Maverick. ➤ Qwen3 Coder 480B ha parametri totali 480B con 35B attivi. Questo modello è particolarmente efficace per la codifica agentica e può essere utilizzato in una varietà di strumenti di agenti di codifica, tra cui l'interfaccia a riga di comando Qwen3-Coder. I lanci di Cerebras rappresentano la prima volta che questo livello di intelligenza è stato accessibile a queste velocità di output e hanno il potenziale per sbloccare nuovi casi d'uso, come l'utilizzo di un modello di ragionamento per ogni fase di un agente senza dover attendere minuti.
25,23K