Embora os laboratórios usem o RL há algum tempo, a maioria das empresas ainda usa apenas pesos de modelo prontos para uso. O grande desbloqueio para a IA corporativa serão os ambientes RL em empresas que aprendem e codificam seu molho secreto. As empresas são valiosas por um motivo - elas têm dados de uso exclusivos, um relacionamento com os clientes e, muitas vezes, conhecimento e processo institucionais. Se as grandes empresas não aproveitarem essa vantagem, elas nivelarão o campo de jogo para os concorrentes. Esta semana no HITL, Mark, Sam e eu conversamos sobre RLVR e outras notícias de IA, incluindo o investimento da Meta na Scale.
Confira:
652