ラボではしばらくの間 RL が使用されてきましたが、ほとんどの企業はまだ既製のモデルの重みを使用しているだけです。エンタープライズAIの大きなロックインメントは、秘密のソースを学習してエンコードする企業のRL環境です。 企業が価値があるのには理由があります -- 独自の使用状況データ、顧客との関係、そして多くの場合、組織的な知識とプロセスを持っています。大企業がこの利点を活用しなければ、競合他社の競争の場を平等にすることになります。 今週の HITL では、Mark、Sam と私は、RLVR や、Meta の Scale への投資を含むその他の AI ニュースについて話しました。
試してみて下さい:
613