Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nghiên cứu của Nous giới thiệu Hermes 4, dòng mô hình lý luận hybrid mới nhất của chúng tôi.
Hermes 4 xây dựng trên di sản của chúng tôi về các mô hình phù hợp với người dùng với khả năng tính toán mở rộng trong thời gian kiểm tra.
Chúng tôi đã đặc biệt chú ý đến việc làm cho các mô hình trở nên sáng tạo và thú vị để tương tác, không bị cản trở bởi kiểm duyệt, và được định hướng trung lập trong khi vẫn duy trì hiệu suất toán học, lập trình và lý luận ở mức độ tiên tiến nhất cho các mô hình trọng số mở.

10,74K
Nous Research đã đăng lại
1/10🧵 @nousresearch gần đây đã công bố một nghiên cứu thú vị cho thấy các mô hình mở sử dụng nhiều token hơn 2-3 lần so với các mô hình đóng cho các nhiệm vụ suy luận.
Chúng tôi đã thử nghiệm xem việc phân bổ token động có thể giúp giải quyết khoảng cách hiệu quả này hay không. Đây là những gì chúng tôi đã học được 👇
8,02K
Đo lường Hiệu quả Tư duy trong các Mô hình Lập luận: Tiêu chuẩn Thiếu hụt
Chúng tôi đã đo lường việc sử dụng token trong các mô hình lập luận: các mô hình mở xuất ra 1.5-4 lần nhiều token hơn so với các mô hình đóng trên các nhiệm vụ giống nhau, nhưng với sự biến động lớn tùy thuộc vào loại nhiệm vụ (lên đến 10 lần trên các câu hỏi đơn giản).
Chi phí ẩn này thường làm mất đi lợi thế về giá theo token. Hiệu quả token nên trở thành mục tiêu chính bên cạnh các tiêu chuẩn độ chính xác, đặc biệt là khi xem xét các trường hợp sử dụng không liên quan đến lập luận.
Đọc bài đánh giá chi tiết về hiệu quả lập luận trong bối cảnh các mô hình mở và đóng trong bài viết blog mới nhất của chúng tôi, hợp tác với nhà nghiên cứu của chúng tôi, Tim.
Xem thêm công việc của họ tại đây:

48,7K
Nous Research đã đăng lại
Môi trường đánh giá Arena-Hard hiện đã được hợp nhất với Atropos - tận hưởng việc đánh giá linh hoạt, quy mô và hiện đại với bộ chuẩn arena-hard của @lmsysorg, rất tuyệt vời trong việc xác định nhiều khả năng khác nhau của các mô hình.
Sẵn sàng trở thành một môi trường RL nếu bạn mang theo bộ dữ liệu huấn luyện của riêng mình nữa :)
Tìm hiểu thêm tại

6,95K
Nghiên cứu viên của chúng tôi @yaboilyrical sẽ thảo luận về công việc của anh ấy về việc điều khiển SMC tại UC Berkeley vào ngày 3 tháng 8.
Hãy xem blog về công việc này tại đây:
Chi tiết bên dưới!

nightwing25 thg 7, 2025
rất hào hứng thông báo rằng tôi sẽ là diễn giả tại Hội nghị DeAI của @BerkeleyRDI, trình bày nghiên cứu của tôi với @NousResearch về giải mã ngôn ngữ có giới hạn!
nếu bạn tham dự hội nghị, hoặc muốn đến xem bài nói của tôi, xin vui lòng liên hệ với tôi!

10,97K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất