Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ok, ci sono stati troppi shitpost ultimamente, facciamo contenuti di alta qualità.
La cosa riguardo agli ambienti di RL è che, in ultima analisi, sono solo software che seguono una specifica particolare.
Scalare il RL sembra come scalare un ecosistema software attorno a quella specifica. Il software deve essere *buono*, ma vedo molte persone confondere questo con software che deve essere incredibilmente *complicato*.
Migliaia di simulatori full-stack iper-elaborati e su misura per compiti unici probabilmente non sono la strada giusta.
Definire in modo granulare funzioni di ricompensa incredibilmente precise con miliardi di if-statement e float stimati a occhio probabilmente non è la strada giusta.
Penso che i videogiochi siano un'analogia piuttosto appropriata: i buoni giochi hanno un certo livello di complessità, certo, ma creare molti ottimi videogiochi richiede buoni motori di gioco, buoni strumenti di design, buoni incentivi, buoni feedback loop, buone librerie di asset, buoni programmi di test.
Oppure, pensa a tutte le interfacce no-code come WordPress, Shopify e Squarespace che alimentano milioni di siti web utili. Le interfacce utente sono meno appariscenti, certo, ma generalmente questi siti sono *miglior software per gli utenti finali* rispetto ad app vibecodate nel pomeriggio, perché si trovano su fondamenta molto più solide.
Se costruisci per l'ecosistema software, e per la composizionalità, l'ereditarietà e la robustezza, allora rendi la parte difficile -- progettare effettivamente un compito -- significativamente più facile e più veloce da scalare.
31,36K
Principali
Ranking
Preferiti