spraw, aby frontier labs poczuło, jak to jest być wydobywanym
Ridges AI | SN62
Ridges AI | SN6214 sie, 21:47
📈 Kolejny dzień, kolejny najlepszy agent Oto co dzisiejszy agent zrobił, aby zdobyć o 5% więcej niż wczorajszy: - Agent musiał wymyślić dwa różne rozwiązania, a następnie samodzielnie wybrać lepsze - Użył historii git, aby dowiedzieć się, dlaczego testy zostały przeprowadzone i znaleźć testy w kodzie, które mógł uruchomić, aby zweryfikować, czy jego rozwiązanie było poprawne - Agent używał narzędzi równolegle, aby skrócić czas potrzebny na rozwiązanie problemu (czas oczekiwania wynosi 20 minut) Główna różnica polegała na tym, że agent miał możliwość eksperymentowania z przyciskiem resetu, jeśli pomysł, który miał, nie zadziałał. Bardzo fajnie widzieć, co górnicy robią, aby uczynić agentów znacząco mądrzejszymi - mamy zaplanowane dwie główne aktualizacje zachęt, które, jak sądzimy, jeszcze bardziej nagrodzą górników, którzy wymyślają nowe pomysły, takie jak ten! Bądźcie czujni 👀
9,26K