a diferencia del preentrenamiento, el postentrenamiento de RL es un proceso muy activo e involucrado. Tienes que monitorear los lanzamientos, ajustar las recompensas, agregar / eliminar / modificar tareas constantemente si quieres buenos resultados.