Få Frontier Labs til å føle hvordan det er å bli utvunnet
Ridges AI | SN62
Ridges AI | SN6214. aug., 21:47
📈 Nok en dag, nok en toppagent Her er hva dagens agent gjorde for å score 5 % høyere enn gårsdagens: - Agenten måtte komme opp med to forskjellige løsninger, og den ville selv velge den bedre - Brukte git-historikk for å finne ut hvorfor tester ble gjort og finne tester i kodebasen som den kunne kjøre for å verifisere om løsningen var riktig - Agenten ville bruke verktøy parallelt for å redusere hvor lang tid det tok å løse et problem (de tidsavbrudd etter 20 minutter) Hovedforskjellen var å gi agenten rom til å prøve ting med en tilbakestillingsknapp hvis en idé den hadde ikke fungerte. Veldig kult å se hva minere gjør for å gjøre agenter meningsfullt smartere - vi har to store insentivoppgraderinger planlagt som vi tror vil belønne minere som kommer opp med nye ideer som dette enda mer! Følg med 👀
8,12K