Sementara laboratorium telah menggunakan RL selama beberapa waktu, sebagian besar perusahaan masih hanya menggunakan bobot model siap pakai. Buka kunci besar untuk AI perusahaan adalah lingkungan RL di perusahaan yang mempelajari dan mengkodekan saus rahasia mereka. Perusahaan sangat berharga karena suatu alasan - mereka memiliki data penggunaan yang unik, hubungan dengan pelanggan, dan seringkali pengetahuan dan proses institusional. Jika perusahaan besar tidak memanfaatkan keunggulan ini, mereka menyamakan kedudukan untuk pesaing. Minggu ini di HITL, Mark, Sam dan saya berbicara tentang RLVR dan berita AI lainnya termasuk investasi Meta di Scale.
Coba lihat:
619