Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ÚLTIMA HORA: Após passagens pelo Google Brain, DeepMind e, mais recentemente, Meta AI, @agarwl_ está a deixar a empresa em vez de se juntar ao novo laboratório de Superinteligência.
Ele está a preparar-se para enfrentar "um tipo diferente de risco."


26/08, 01:38
Esta é a minha última semana na @AIatMeta. Foi uma decisão difícil não continuar com o novo laboratório de Superinteligência TBD, especialmente dado o talento e a densidade de computação. Mas, após 7,5 anos entre o Google Brain, DeepMind e Meta, senti a necessidade de assumir um tipo diferente de risco.
A proposta do Mark e do @alexandr_wang para construir na equipe de Superinteligência foi incrivelmente convincente. Mas, no final, escolhi seguir o próprio conselho do Mark: “Em um mundo que está mudando tão rápido, o maior risco que você pode correr é não correr nenhum risco”.
No meu curto tempo na Meta, conseguimos avançar na fronteira do pós-treinamento para modelos de "pensamento". Especificamente:
- Impulsionando um modelo denso de 8B para desempenho próximo ao Deepseek-R1 com escalonamento RL.
- Usando dados sintéticos durante o treinamento para iniciar o RL.
- Desenvolvendo melhores métodos de destilação on-policy.
Realmente gostei de trabalhar com @_arohan_, @brandfonbrener, Leo Li, @ErykHelenowski, @DatHuynh13, Xiaocheng, Jia, Boduo e Yanjun.
20,01K
Top
Classificação
Favoritos