Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

François Chollet
Đồng sáng lập @ndea. Đồng sáng lập @arcprize. Người tạo ra Keras và ARC-AGI. Tác giả của 'Deep Learning with Python'.
Chúng tôi đã có thể tái hiện những phát hiện mạnh mẽ của bài báo HRM về ARC-AGI-1.
Hơn nữa, chúng tôi đã thực hiện một loạt các thí nghiệm loại bỏ để tìm hiểu điều gì đứng sau nó.
Những phát hiện chính:
1. Kiến trúc mô hình HRM (trung tâm của bài báo) không phải là yếu tố quan trọng.
2. Vòng lặp tinh chỉnh bên ngoài (chỉ được đề cập sơ qua trong bài báo) là yếu tố chính thúc đẩy hiệu suất.
3. Học chuyển giao giữa các nhiệm vụ không thực sự hữu ích. Điều quan trọng là đào tạo trên các nhiệm vụ mà bạn sẽ kiểm tra.
4. Bạn có thể sử dụng ít các phương pháp tăng cường dữ liệu hơn, đặc biệt là trong thời gian suy diễn.
Phát hiện 2 & 3 có nghĩa là phương pháp này là một trường hợp của *đào tạo tại thời điểm kiểm tra không cần tiền đào tạo*, tương tự như bài báo "ARC-AGI không cần tiền đào tạo" gần đây được công bố bởi Liao và các cộng sự.
332,46K
Các câu hỏi mở về kinh tế của dịch vụ gọi xe không người lái:
1. Việc loại bỏ tài xế sẽ giảm chi phí (so với Uber/Lyft) bao nhiêu?
2. Sự giảm chi phí đó sẽ làm tăng nhu cầu bao nhiêu?
3. Liệu sự thay đổi trải nghiệm người dùng có ảnh hưởng đáng kể đến nhu cầu không?
4. Chúng ta có thấy sự gia tăng lớn về khả năng tiếp cận địa lý (không cần tài xế = có thể đưa nhiều taxi ra đường hơn) không?
Về câu 1: chi phí lao động của một chuyến đi Lyft/Uber sau khi tính toán mọi thứ khác chỉ chiếm 20-40% giá, điều này giới hạn mức giảm tối đa ở -40% trong kịch bản tốt nhất. Tuy nhiên, một mạng lưới taxi không người lái sẽ có chi phí cố định cao hơn đáng kể (kỹ sư AI, trung tâm dữ liệu) và chi phí đơn vị bổ sung không bằng không (vệ sinh nội thất thường xuyên, khấu hao phần cứng tự lái), vì vậy thực tế chúng ta đang nhìn vào mức giảm khoảng -15-20%.
Vì vậy, không thể phủ nhận rằng dịch vụ đi xe tự động, khi được triển khai quy mô lớn, sẽ rẻ hơn so với các dịch vụ gọi xe hiện tại. Nhưng kích thước hiệu ứng sẽ nhỏ hơn nhiều so với hầu hết mọi người mong đợi. Chúng vẫn sẽ khá đắt.
Về câu 2: có lẽ không nhiều lắm -- vì giá cả động, giá đã dao động nhiều hơn thế này, và vài năm trước Uber đã trợ giá mạnh cho nhu cầu, vì vậy chúng ta có một số dữ liệu về những gì sẽ xảy ra với các chuyến đi rẻ hơn 20%. Thị trường tiềm năng (TAM) ở những khu vực đã được phục vụ tốt bởi Uber/Lyft có thể tăng khoảng 20% về số dặm, trong khi vẫn giữ nguyên về giá trị đô la.
Về câu 3: chúng ta đã biết (thông qua các triển khai của Waymo) rằng mọi người thích không có tài xế trong xe, và những khách hàng không nhạy cảm với giá sẵn sàng trả nhiều hơn cho trải nghiệm đó. Tuy nhiên, không phải tất cả đều tích cực: đã có những lo ngại về sự sạch sẽ của xe (dễ giải quyết, nhưng điều đó làm tăng chi phí đơn vị). Tổng thể, tôi không nghĩ rằng sự thay đổi trải nghiệm người dùng sẽ làm tăng TAM nhiều, vì đối với hầu hết mọi người, giá cả và khả năng tiếp cận sẽ là những yếu tố quan trọng.
Về câu 4: điều này là một yếu tố không chắc chắn hơn. Hầu hết chi phí của một mạng lưới tự động là chi phí cố định; chi phí đơn vị bổ sung chủ yếu là khấu hao chi phí xe (một lỗi làm tròn) và vệ sinh. Điều này có nghĩa là một mạng lưới tự động có tiềm năng có độ phủ cao hơn nhiều so với mạng lưới Uber/Lyft hiện tại. Nhưng chắc chắn sẽ không phải là trường hợp rằng những mạng lưới này sẽ mở rộng *bất cứ đâu*, ít nhất là không với thời gian chờ ngắn. Tôi nghĩ chúng ta sẽ thấy một số tăng trưởng TAM từ hiệu ứng này, có thể +20-30%.
Tổng thể: chúng ta nên kỳ vọng một sự gia tăng TAM theo từng bước về giá trị đô la, nhưng nhìn chung thị trường sẽ giống như Uber++ hơn là một mô hình giao thông mới. Hầu hết mọi người ở Mỹ, đặc biệt là ngoài các khu vực đông đúc, vẫn sẽ lái xe của riêng họ.
36,66K
Grok 4 vẫn là công nghệ tiên tiến nhất trên ARC-AGI-2 trong số các mô hình tiên phong.
15,9% cho Grok 4 so với 9,9% cho GPT-5.

ARC Prize01:29 8 thg 8
GPT-5 trên Đánh giá Bán riêng ARC-AGI
GPT-5
* ARC-AGI-1: 65.7%, $0.51/công việc
* ARC-AGI-2: 9.9%, $0.73/công việc
GPT-5 Mini
* ARC-AGI-1: 54.3%, $0.12/công việc
* ARC-AGI-2: 4.4%, $0.20/công việc
GPT-5 Nano
* ARC-AGI-1: 16.5%, $0.03/công việc
* ARC-AGI-2: 2.5%, $0.03/công việc

746
Kết quả GPT-5 trên ARC-AGI 1 & 2!
Dòng chính:
65.7% trên ARC-AGI-1
9.9% trên ARC-AGI-2

ARC Prize01:29 8 thg 8
GPT-5 trên Đánh giá Bán riêng ARC-AGI
GPT-5
* ARC-AGI-1: 65.7%, $0.51/công việc
* ARC-AGI-2: 9.9%, $0.73/công việc
GPT-5 Mini
* ARC-AGI-1: 54.3%, $0.12/công việc
* ARC-AGI-2: 4.4%, $0.20/công việc
GPT-5 Nano
* ARC-AGI-1: 16.5%, $0.03/công việc
* ARC-AGI-2: 2.5%, $0.03/công việc

39,16K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất