6 hengen startup 500 000 dollarilla on juuri päihittänyt Microsoftin! OpenAI:n MLE-Bench on vertailukohta, joka testaa agentteja koneoppimisen suunnittelutehtävissä. NEO @withneo, ensimmäinen autonominen MLE-agentti, sai 34,2 % verrattuna Microsoftin 22,4 %:iin. Tämä on valtava!
5,68K