"¿Te disparan en San Francisco si usas mayúsculas?"
tokenbender
tokenbender9 ago, 22:30
¿Es posible preentrenar un modelo de lenguaje utilizando aprendizaje por refuerzo puro desde cero? Pesos aleatorios, sin preentrenamiento de pérdida de entropía cruzada. Puede que tengas muchas preguntas en tu cabeza.
136.04K