Aunque los laboratorios han estado utilizando RL durante algún tiempo, la mayoría de las empresas todavía están usando pesos de modelo estándar. El gran desbloqueo para la IA empresarial será tener entornos de RL en las empresas que aprendan y codifiquen su secreto. Las empresas son valiosas por una razón: tienen datos de uso únicos, una relación con los clientes y, a menudo, conocimiento institucional y procesos. Si las grandes empresas no aprovechan esta ventaja, nivelan el campo de juego para los competidores. Esta semana en HITL, Mark, Sam y yo hablamos sobre RLVR y otras noticias de IA, incluida la inversión de Meta en Scale.
Mira esto:
633