O algoritmo X deve ser RL'd com sua recompensa sendo a escala de Kardashev