ÚLTIMA HORA: Después de trabajar en Google Brain, DeepMind y, más recientemente, en Meta AI, @agarwl_ está dejando la empresa en lugar de unirse al nuevo laboratorio de Superinteligencia. Se dirige a asumir "un tipo diferente de riesgo."
Rishabh Agarwal
Rishabh Agarwal26 ago, 01:38
Esta es mi última semana en @AIatMeta. Fue una decisión difícil no continuar con el nuevo laboratorio de Superinteligencia TBD, especialmente dado el talento y la densidad de computación. Pero después de 7.5 años en Google Brain, DeepMind y Meta, sentí la necesidad de asumir un tipo diferente de riesgo. La propuesta de Mark y @alexandr_wang para construir en el equipo de Superinteligencia fue increíblemente convincente. Pero al final elegí seguir el propio consejo de Mark: “En un mundo que cambia tan rápido, el mayor riesgo que puedes tomar es no tomar ningún riesgo”. En mi breve tiempo en Meta, realmente empujamos la frontera en el post-entrenamiento para modelos de "pensamiento". Específicamente: - Impulsar un modelo denso de 8B a un rendimiento cercano al Deepseek-R1 con escalado de RL. - Usar datos sintéticos a mitad de entrenamiento para iniciar el RL. - Desarrollar mejores métodos de destilación en política. Realmente disfruté trabajar con @_arohan_, @brandfonbrener, Leo Li, @ErykHelenowski, @DatHuynh13, Xiaocheng, Jia, Boduo y Yanjun.
19,55K