"¿Te disparan en San Francisco si usas letras mayúsculas?"
tokenbender
tokenbender9 ago 2025
¿Es posible preentrenar un modelo de lenguaje utilizando aprendizaje por refuerzo puro desde cero? Pesos aleatorios, sin preentrenamiento con pérdida de entropía cruzada. Puede que tengas muchas preguntas en tu cabeza.
136,08K