我可能可以通過根據模型需要更快的工作週期來動態調整我的模擬中的 d/t,從而大大提高訓練效果。一些行動是非常明顯的,而另一些則更具動態性,需要這樣做。
有很多值得嘗試的事情我能想到,但我實在沒有時間。我需要雇人。
4.6K