Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ok, últimamente hay demasiados shitposts, así que hagamos contenido de alta calidad.
Lo que pasa con los entornos de RL es que, en última instancia, son solo software que sigue una especificación particular.
Escalar RL se parece a escalar un ecosistema de software en torno a esa especificación. El software necesita ser *bueno*, pero veo a mucha gente confundiendo esto con software que necesita ser increíblemente *complicado*.
Miles de simulaciones a medida y hiperelaboradas para tareas únicas probablemente no sean el camino.
Definir de manera granular funciones de recompensa increíblemente precisas con billones de declaraciones if y flotantes estimados probablemente no sea el camino.
Creo que los videojuegos son una analogía bastante adecuada: los buenos juegos tienen un cierto nivel de complejidad, claro, pero hacer muchos grandes videojuegos requiere buenos motores de juego, buenas herramientas de diseño, buenos incentivos, buenos bucles de retroalimentación, buenas bibliotecas de activos, buenos programas de prueba.
O, piensa en todas las interfaces sin código como WordPress, Shopify y Squarespace que alimentan millones de sitios web útiles. Las interfaces son menos llamativas, claro, pero generalmente estos sitios son *mejor software para los usuarios finales* que las aplicaciones de vibra de la tarde, porque se asientan sobre bases mucho más sólidas.
Si construyes para el ecosistema de software, y para la composicionalidad, la herencia y la robustez, entonces haces que la parte difícil -- diseñar una tarea -- sea significativamente más fácil y más rápida de escalar.
33,41K
Parte superior
Clasificación
Favoritos