Bien que les laboratoires utilisent le RL depuis un certain temps, la plupart des entreprises se contentent encore d'utiliser des poids de modèle prêts à l'emploi. Le véritable déblocage pour l'IA d'entreprise sera les environnements RL dans les entreprises qui apprennent et codifient leur recette secrète. Les entreprises ont de la valeur pour une raison -- elles disposent de données d'utilisation uniques, d'une relation avec les clients, et souvent d'un savoir institutionnel et de processus. Si les grandes entreprises ne tirent pas parti de cet avantage, elles nivelent le terrain de jeu pour les concurrents. Cette semaine sur HITL, Mark, Sam et moi avons parlé de RLVR et d'autres nouvelles sur l'IA, y compris l'investissement de Meta dans Scale.
Regarde:
618