Un startup de 6 persoane cu 500 de mii de dolari tocmai a depășit Microsoft! MLE-Bench de la OpenAI este un punct de referință care testează agenții pe sarcini de inginerie de învățare automată. NEO @withneo, primul agent MLE autonom, a obținut un scor de 34,2% față de 22,4% al Microsoft la benchmark. Acest lucru este uriaș!
5,71K