Незважаючи на те, що лабораторії вже деякий час використовують RL, більшість підприємств все ще просто використовують готові моделі ваги. Великим розблокуванням для корпоративного штучного інтелекту стануть середовища RL у компаніях, які навчаються та кодують свій секретний соус. Компанії цінні не просто так – вони мають унікальні дані про використання, відносини з клієнтами, а часто і інституційні знання та процеси. Якщо великі компанії не використовують цю перевагу, вони вирівнюють правила гри для конкурентів. Цього тижня на HITL Марк, Сем і я говорили про RLVR та інші новини штучного інтелекту, включаючи інвестиції Meta в Scale.
Подивіться:
612