"強化預訓練" 在你想要使用思維鏈來提高在預測這個 _____ 的下一個單詞等任務的表現時非常有用。
這方面已經有大約 5 篇論文了。它們都顯示出在單一代幣預測任務上,這種方法比什麼都不做要好。當然是這樣!如果不是,那就太瘋狂了! 有沒有哪篇論文顯示出有趣或驚人的東西?
7.14K