"Не важно, верите вы в это или нет. Важно, правда это или нет." Существует много шума о том, что предобучение достигло предела. @OfficialLoganK сразу же это опровергает. "В принципе, каждый другой шаг в процессе разработки модели является усилением базовой предобученной модели." Даже если кривая немного выровняется, downstream-эффект будет огромным. Если вы начинаете с "монстра" предобученной модели, каждый последующий шаг, от постобучения до тонкой настройки, умножает это преимущество. #AI #LLM #MachineLearning #AITraining