这个3b1b的可视化展示了大型语言模型如何逐层工作,真是我们从未意识到的真正脑洞大开。
278.81K