Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ho parlato con @willccbb, si è rivelato essere proprio quello che pensavo.
Un agente con una funzione di invio per revisione.
L'agente è semplicemente un llm in un ciclo di forma.
La funzione di revisione è solo un altro agente con un rubric che approssima una funzione di perdita.

24 ago, 05:22
Qualcuno può spiegarmi cos'è un ambiente RL.
25,06K
Principali
Ranking
Preferiti