Julkaisemme BrowseCompin, joka on lyhenne sanoista Browsing Competition. 🏎️ Ajattele sitä kuin koodaus- tai matematiikkakilpailuja – vaikka nämä kilpailut eivät ehkä heijasta täydellisesti todellista SWE:tä tai matemaattista tutkimusta, ne vangitsevat älykkyyden kipinän. Tämä on vertailukohta, josta meidän tulisi huolehtia arvioidessamme syvällisen tutkimuksen kaltaisten selausagenttien älykkyyttä.
OpenAI
OpenAI11.4.2025
Käytämme avoimen lähdekoodin BrowseCompia ("Browsing Competition"), uutta, haastavaa vertailuarvoa, joka on suunniteltu testaamaan, kuinka hyvin tekoälyagentit voivat selata Internetiä löytääkseen vaikeasti löydettävää tietoa. Se on kuin online-aarteenmetsästys... mutta selausagenteille.
465,35K