狂った若者たちは「ネイティブ・スパース・アテンション」でみんなを誤解させ、ポストホックなスパース性がいかに悪いか、そしてゼロから事前トレーニングする必要があるトートバッグであることを長々と説明しました。V3チェックポイントをスパース化しました。 これは、すべての高密度の attn モデルに一般的に当てはまることを認識していますか?