私はサンフランシスコが嫌いです。VLAこれ。VLAそれ。アクショントークンを出力するクソビジョン言語モデルです。 「わかりました。それは脳であり、何かをします。しかし、このサブセットは私が誇大宣伝しています」