Neue Forschung von Meta FAIR: Code World Model (CWM), ein 32B Forschungsmodell
Wir ermutigen die Forschungsgemeinschaft, dieses Open-Weight-Modell zu erforschen!
Pass@1-Evaluierungen, für die Neugierigen:
65,8 % auf SWE-bench Verifiziert
68,6 % auf LiveCodeBench
96,6 % auf Math-500
76,0 % auf AIME 2024
🧵
Vielleicht sollte ich einen Stream im Jonathan Blow-Stil machen? Auf x? YouTube? Twitch? Ich wäre neugierig, wie nah oder weit ich von der '--yolo'-Crowd entfernt bin ...
Ich finde die Anzahl der Menschen, die den --yolo-Modus empfehlen, sehr interessant. Ich denke, was ich mit KI-unterstützter Softwareentwicklung mache und was viele von euch mit KI-Softwareentwicklung machen (ich bin mir nicht sicher, ob das überhaupt noch als 'unterstützt' betrachtet werden kann?), ist sehr unterschiedlich.
Ich finde die Anzahl der Menschen, die den --yolo-Modus empfehlen, sehr interessant. Ich denke, was ich mit KI-unterstützter Softwareentwicklung mache und was viele von euch mit KI-Softwareentwicklung machen (ich bin mir nicht sicher, ob das überhaupt noch als 'unterstützt' betrachtet werden kann?), ist sehr unterschiedlich.