虽然实验室已经使用强化学习(RL)一段时间,但大多数企业仍然只是使用现成的模型权重。企业人工智能的重大突破将是公司内部的强化学习环境,这些环境能够学习并编码它们的独特秘诀。 公司之所以有价值,是因为它们拥有独特的使用数据、与客户的关系,以及通常的机构知识和流程。如果大公司不利用这一优势,就会为竞争对手平衡竞争环境。 本周在HITL节目中,Mark、Sam和我讨论了RLVR和其他人工智能新闻,包括Meta对Scale的投资。
看看这个:
621