Een startup van 6 personen met $500k heeft Microsoft net overtroffen! OpenAI's MLE-Bench is een benchmark die agents test op Machine Learning engineering taken. NEO @withneo, de eerste autonome MLE-agent, scoorde 34,2% tegenover Microsoft’s 22,4% op de benchmark. Dit is enorm!
5,61K