⚡𝐅𝐏𝟖 hace que RL sea más rápido, pero a costa del rendimiento. Presentamos 𝐅𝐥𝐚𝐬𝐡𝐑𝐋, la primera receta de RL 𝐨𝐩𝐞𝐧–𝐬𝐨𝐮𝐫𝐜𝐞 y 𝐦𝐨𝐝𝐞𝐥𝐨𝐫𝐚 que aplica 𝐈𝐍𝐓𝟖/𝐅𝐏𝟖 para el rollout sin perder rendimiento en comparación con 𝐁𝐅𝟏𝟔! 📝 Blog: 💻 Código:
40.55K