"No se trata de si lo crees o no. Se trata de si es verdad." Hay mucho ruido sobre el pre-entrenamiento que está llegando a un límite. @OfficialLoganK lo desmiente de inmediato. "Principalmente, cada otro paso en el proceso de desarrollo del modelo es una amplificación del modelo pre-entrenado subyacente." Incluso si la curva se aplana ligeramente, el efecto a largo plazo es masivo. Si comienzas con un modelo pre-entrenado "bestial", cada paso subsiguiente, desde el post-entrenamiento hasta el ajuste fino, multiplica esa ventaja. #AI #LLM #MachineLearning #AITraining