DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

DERNIÈRE MINUTE : xAI annonce Grok 4 "Il peut raisonner à un niveau surhumain !" Voici tout ce que vous devez savoir :

Elon affirme que Grok 4 est plus intelligent que presque tous les étudiants diplômés de toutes les disciplines simultanément. 100 fois plus d’entraînement que Grok 2. 10 fois plus de calcul sur RL que n’importe quel modèle existant.

Performance sur le dernier examen de l’humanité Elon : « Grok 4 est de niveau post-universitaire dans tous les domaines ! »

Mise à l’échelle de HLE - Formation Plus de calcul, plus d’intelligence. (pas d’outils)

Avec l'appel d'outils natifs, Grok 4 augmente considérablement les performances. Regardez ces courbes ! Il est important de donner les bons outils à l'IA. L'échelle est claire. Fou !

Des signaux fiables sont essentiels pour faire fonctionner le RL. Il reste encore le défi des données. Elon : "Le test ultime de raisonnement est l'IA opérant dans la réalité."

Mise à l’échelle du calcul au moment du test Plus de 50 % du sous-ensemble de texte uniquement des problèmes HLE sont résolus ! Les courbes deviennent de plus en plus ridicules.

Grok 4 est la version à agent unique. Grok 4 Heavy est la version à agents multiples. Les systèmes multi-agents ne sont pas à prendre à la légère !

Grok 4 est utilisé pour prédire les champions de la World Series cette année. Voici les tâches intéressantes sur lesquelles les modèles de raisonnement doivent être testés. Sur des événements réels.

Une visualisation de deux trous noirs en collision. Grok 4 utilise toutes sortes de références comme des articles, lit des PDF, raisonne sur les détails de la simulation et quelles données utiliser.

L’exemple montre un résumé de la chronologie, des modifications et des annonces de score dans le HLE. C’est plutôt cool !

Performances multimodales Les performances du Grok 4 Heavy sont supérieures à celles du Grok 4, mais doivent encore être améliorées. C’est l’une des faiblesses, selon l’équipe.

Performance sur les benchmarks de raisonnement. Score parfait sur AIME25 ! Les sauts sont fous par rapport au dernier meilleur modèle sur ces tâches.

Où tester les modèles. Disponible en tant que niveau SuperGrok Heavy. 30 $/mois pour Super Grok 300 $/m pour le SuperGrok Heavy.

Mises à jour vocales incluses ! Grok est plus vif et est conçu pour être plus naturel. - 2x plus rapide - 5 voix - 10 fois le nombre de secondes d’utilisation par jour

ARC-AGI Grok 4 sur ARC-AGI v2 (sous-ensemble privé) Il franchit la barre des 10 % (15,9 %). 2x la deuxième place, qui est le modèle Claude Opus 4.

Grok 4 sur banc distributeur automatique Grok 4 obtient la place #1. Le double de la valeur nette de Claude Opus 4.

Les modèles Grok 4 sont disponibles via l'API xAI. Fenêtre de contexte de 256K. Recherche de données en temps réel.

Grok 4 pour les jeux ! La compréhension de la vidéo est un domaine que l’équipe améliore, donc elle va s’améliorer.

Quelle est la prochaine étape ? L’intelligence et la rapidité seront au centre de l’attention. Les modèles de codage sont également au centre de l’attention. Des agents multimodaux plus performants arrivent également. Des modèles de génération de vidéos se profilent également à l’horizon.

@elonmusk et l’équipe @xai ont vraiment cuisiné avec Grok 4. C’est très excitant de voir se concentrer sur l’IA pour la réalité, la recherche de la vérité et le déverrouillage des agents multimodaux ensuite.

J’ai commencé à expérimenter avec Grok 4 et j’ai déjà trouvé des choses intéressantes à son sujet. Je prépare une comparaison détaillée avec d’autres modèles de raisonnement. J’animerai bientôt un atelier sur Grok 4 pour les membres de notre académie :

2,19M

Meilleurs

Classement

Favoris

Tendance on-chain

Tendance sur X

Récents financements de premier plan

Les plus notables