Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Після роботи в Google Brain, DeepMind і зовсім недавно в Meta AI @agarwl_ залишає компанію, а не приєднується до нової лабораторії суперінтелекту.
Він збирається піти на "інший вид ризику".


9 годин тому
Це мій останній тиждень у @AIatMeta. Це було важке рішення не продовжувати роботу з новою лабораторією Superintelligence TBD, особливо з огляду на талант і щільність обчислень. Але після 7,5 років роботи в Google Brain, DeepMind і Meta я відчув потяг взяти на себе інший вид ризику.
Пропозиція від Марка та @alexandr_wang створити команду Superintelligence була неймовірно переконливою. Але в кінцевому підсумку я вирішив слідувати пораді самого Марка: «У світі, який так швидко змінюється, найбільший ризик, на який ви можете піти, — це не ризикувати».
За короткий час моєї роботи в Meta ми розширили межі в пост-тренінгу для моделей «мислення». Специфічно:
- Підвищення щільної моделі 8B до продуктивності, близької до Deepseek-R1, з масштабуванням RL.
- Використання синтетичних даних під час тренування для розігріву РЛ.
- Розробка кращих методів дистиляції на основі політики.
Дуже сподобалося працювати з @_arohan_, @brandfonbrener, Лео Лі, @ErykHelenowski, @DatHuynh13, Xiaocheng, Jia, Boduo та Yanjun.
8,89K
Найкращі
Рейтинг
Вибране