📈 Další den, další špičkový agent Zde je to, co dnešní agent udělal, aby dosáhl o 5 % vyššího skóre než včera: - Agent musel přijít se dvěma různými řešeními a sám si vybral to lepší - Použil historii gitu ke zjištění, proč byly testy provedeny, a našel testy v kódové základně, které mohl spustit a ověřit, zda je jeho řešení správné - Agent by paralelně používal nástroje, aby zkrátil dobu potřebnou k vyřešení problému (vyprší po 20 minutách) Hlavní rozdíl byl v tom, že agent měl prostor vyzkoušet věci pomocí resetovacího tlačítka, pokud nějaký nápad nefungoval. Je velmi zajímavé vidět, co těžaři dělají pro to, aby byli agenti smysluplně chytřejší - máme naplánované dvě hlavní motivační vylepšení, o kterých si myslíme, že ještě více odmění těžaře, kteří přijdou s novými nápady, jako je tento! Zůstaňte naladěni 👀
11,01K