Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
BREAKING: xAI kündigt Grok 4 an
"Es kann auf übermenschlichem Niveau logisch denken!"
Hier ist alles, was Sie wissen müssen:

Elon behauptet, dass Grok 4 intelligenter ist als fast alle Doktoranden in allen Disziplinen gleichzeitig.
100x mehr Training als Grok 2.
10x mehr Rechenleistung auf RL als auf jedem anderen Modell auf dem Markt.

Leistung bei der letzten Prüfung der Menschheit
Elon: "Grok 4 ist in allem auf Postgraduierten-Niveau!"

Skalieren von HLE - Schulung
Mehr Rechenleistung, höhere Intelligenz.
(ohne Werkzeug)

Mit der nativen Tool-Anrufung steigert Grok 4 die Leistung erheblich.
Schau dir diese Kurven an!
Es ist wichtig, der KI die richtigen Werkzeuge zu geben. Die Skalierung ist klar. Verrückt!

Zuverlässige Signale sind der Schlüssel, um RL zum Funktionieren zu bringen.
Es gibt immer noch die Herausforderung der Daten.
Elon: "Der ultimative Test für das Denken ist KI, die in der Realität operiert."
Skalieren von Compute zur Testzeit
Mehr als 50% der reinen Textteilmenge der HLE-Probleme sind gelöst!
Die Kurven werden immer lächerlicher.

Grok 4 ist die Einzelagenten-Version.
Grok 4 Heavy ist die Multi-Agenten-Version.
Multi-Agenten-Systeme sind kein Scherz!

Grok 4 wird verwendet, um die Weltmeisterschaftsmeister für dieses Jahr vorherzusagen.
Dies sind die interessanten Aufgaben, die mit Denkmodellen getestet werden müssen. Bei tatsächlichen realen Ereignissen.

Eine Visualisierung von zwei Schwarzen Löchern, die kollidieren.
Grok 4 verwendet alle Arten von Referenzen wie Papiere, liest PDFs, Gründe für die Details der Simulation und welche Daten verwendet werden sollen.

Das Beispiel zeigt eine Zusammenfassung der Zeitachse/Änderungen und Score-Ankündigungen im HLE.
Das ist ziemlich cool!

Multimodale Leistung
Die Leistung von Grok 4 Heavy ist höher als die von Grok 4, muss aber weiter verbessert werden. Das ist laut dem Team eine der Schwächen.

Leistung bei Reasoning-Benchmarks.
Perfekter Score auf AIME25!
Sprünge sind verrückt im Vergleich zum letzten besten Modell bei diesen Aufgaben.

Wo kann man die Modelle testen?
Erhältlich als SuperGrok Heavy-Stufe.
30 $/m für Super Grok
300 $/m für SuperGrok Heavy.

Auch Sprach-Updates inklusive!
Grok fühlt sich bissiger an und ist so konzipiert, dass es natürlicher ist.
- 2x schneller
- 5 Stimmen
- 10x täglich Benutzersekunden

ARC-AGI
Grok 4 auf ARC-AGI v2 (private Teilmenge)
Es durchbricht die 10%-Grenze (15,9%).
2x den zweiten Platz, das ist das Modell Claude Opus 4.

Grok 4 auf der Verkaufsbank
Grok 4 bekommt den #1 Platz.
Doppelt so viel Nettovermögen wie Claude Opus 4.

Grok 4 Modelle sind über die xAI API verfügbar.
256K Kontextfenster.
Echtzeit-Datensuche.

Grok 4 für Gaming!
Das Videoverständnis ist ein Bereich, den das Team verbessert, also wird es besser werden.

Wie geht es weiter?
Smart und schnell stehen im Mittelpunkt.
Auch die Codierung von Modellen ist ein großer Schwerpunkt.
Auch leistungsfähigere multimodale Agenten werden kommen.
Auch Modelle zur Videogenerierung sind am Horizont zu sehen.

@elonmusk und das @xai Team haben mit Grok 4 richtig gekocht. Alles sehr aufregend zu sehen, wie sich der Fokus als nächstes auf KI für die Realität, die Wahrheitssuche und die Erschließung multimodaler Agenten konzentriert.
Ich habe angefangen, mit Grok 4 zu experimentieren und habe bereits einige interessante Dinge darüber gefunden.
Ich bereite einen detaillierten Vergleich mit anderen Argumentationsmodellen vor.
Ich werde demnächst einen Workshop zu Grok 4 für unsere Akademiemitglieder veranstalten:

2,19M
Top
Ranking
Favoriten