Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Bạn có bao giờ tự hỏi điều gì thực sự cần thiết để đào tạo một mô hình AI tiên tiến không?
Ankit Gupta của YC (@GuptaAnkitV) đã ngồi xuống với Nick Joseph (@nickevanjoseph), Trưởng bộ phận Tiền đào tạo của Anthropic, để khám phá những thách thức kỹ thuật đằng sau việc đào tạo Claude—từ việc quản lý hàng nghìn GPU và gỡ lỗi những lỗi khó chịu đến việc cân bằng tính toán giữa tiền đào tạo và RL.
Họ đề cập đến các quy luật mở rộng, chiến lược dữ liệu, thành phần đội ngũ, và tại sao những vấn đề khó khăn nhất trong AI thường là những vấn đề về cơ sở hạ tầng, không phải là vấn đề ML.
01:05 – Từ Vicarious đến OpenAI đến Anthropic
06:40 – Tiền đào tạo là gì
11:20 – Tại sao dự đoán từ tiếp theo lại chiến thắng
16:05 – Các quy luật mở rộng và vòng phản hồi của tính toán → mô hình → doanh thu
21:50 – Xây dựng cơ sở hạ tầng ban đầu của Anthropic
27:35 – Mẹo hiệu quả và gỡ lỗi quy mô lớn
33:10 – Người tổng quát vs. chuyên gia trong đội tiền đào tạo
38:45 – Những thách thức của việc đào tạo trên hàng nghìn GPU
44:15 – Làm việc với các chip mới: GPU vs. TPU
49:00 – Tiền đào tạo vs. sau đào tạo (RLHF và các mô hình lý luận)
54:25 – Tương lai của chất lượng và khả năng tiếp cận dữ liệu
59:10 – Tiền đào tạo sẽ đi đâu tiếp theo
Đón xem:

82,55K
Hàng đầu
Thứ hạng
Yêu thích