Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

François Chollet
Salah satu pendiri @ndea. Salah satu pendiri @arcprize. Pencipta Keras dan ARC-AGI. Penulis 'Deep Learning with Python'.
François Chollet memposting ulang
Pratinjau ARC-AGI-3: +3 Game Dirilis
Kami telah membuka 3 game penahanan pribadi sebelumnya dari Kompetisi Agen Pratinjau
Sekarang 6 game tersedia untuk dimainkan secara online dan melalui Agents API
Setiap game dipilih untuk memperluas kebaruan game publik ARC-AGI-3
Bisakah Anda mengalahkan mereka?

11,04K
Kami dapat mereproduksi temuan kuat dari makalah HRM tentang ARC-AGI-1.
Selanjutnya, kami menjalankan serangkaian eksperimen ablasi untuk mengetahui apa yang ada di baliknya.
Temuan utama:
1. Arsitektur model HRM itu sendiri (inti dari kertas) bukanlah faktor penting.
2. Loop penyempurnaan luar (hampir tidak disebutkan dalam makalah) adalah pendorong utama kinerja.
3. Pembelajaran transfer lintas tugas tidak terlalu membantu. Yang penting adalah pelatihan tentang tugas yang akan Anda uji.
4. Anda dapat menggunakan augmentasi data yang jauh lebih sedikit, terutama pada waktu inferensi.
Temuan 2 & 3 berarti bahwa pendekatan ini adalah kasus *zero-pretraining test-time training*, mirip dengan makalah "ARC-AGI tanpa pretraining" yang baru-baru ini diterbitkan oleh Liao et al.
332,55K
Pertanyaan terbuka tentang ekonomi pemesanan kendaraan tanpa pengemudi:
1. Apa pengurangan biaya (melalui Uber/Lyft) untuk menghapus pengemudi?
2. Berapa pengurangan biaya itu meningkatkan permintaan?
3. Apakah perubahan UX akan memengaruhi permintaan secara signifikan?
4. Apakah kita akan melihat peningkatan besar dalam ketersediaan geografis (tidak perlu pengemudi = dapat menempatkan lebih banyak taksi di jalan)?
Untuk 1: biaya tenaga kerja perjalanan Lyft/Uber setelah memperhitungkan yang lain hanya 20-40% dari harga, yang membatasi pengurangan pada -40% dalam skenario kasus terbaik. Namun jaringan taksi tanpa pengemudi akan memiliki biaya tetap yang jauh lebih tinggi (insinyur AI, pusat data) dan biaya unit tambahan bukan nol (pembersihan interior yang sering, amortisasi perangkat keras self-driving), jadi secara realistis kami melihat lebih dari -15-20%.
Jadi tidak diragukan lagi bahwa wahana otonom, dalam skala besar, akan lebih murah daripada layanan ride hailing saat ini. Tetapi ukuran efeknya akan jauh lebih kecil dari yang diharapkan kebanyakan orang. Mereka masih akan cukup mahal.
Untuk 2: mungkin tidak terlalu banyak -- karena penetapan harga yang dinamis, harga sudah berfluktuasi lebih dari ini, dan beberapa tahun yang lalu Uber sangat mensubsidi permintaan, jadi kami memiliki beberapa data tentang apa yang akan terjadi dengan perjalanan 20% lebih murah. TAM di daerah yang sudah dilayani dengan baik oleh Uber/Lyft mungkin tumbuh ~20% dalam hal mil, sambil tetap konstan dalam hal dolar.
Untuk 3: kami sudah tahu (melalui penerapan Waymo) bahwa orang lebih suka tidak memiliki pengemudi di dalam mobil, dan pelanggan yang tidak sensitif terhadap harga bersedia membayar lebih untuk pengalaman itu. Itu tidak semuanya positif: ada kekhawatiran tentang kebersihan mobil (mudah ditangani, tetapi itu meningkatkan biaya unit). Secara keseluruhan saya tidak berpikir perubahan UX akan meningkatkan TAM banyak, karena bagi kebanyakan orang harga dan ketersediaan akan menjadi faktor penting.
Untuk 4: ini adalah salah satu yang lebih dari wildcard. Sebagian besar biaya jaringan otonom adalah biaya tetap; Biaya unit tambahan terutama adalah amortisasi biaya mobil (kesalahan pembulatan) dan pembersihan. Ini berarti bahwa jaringan otonom memiliki potensi untuk memiliki jangkauan yang jauh lebih tinggi daripada jaringan Uber/Lyft saat ini. Tetapi tentu saja tidak akan terjadi bahwa jaringan ini akan meluas *ke mana saja*, setidaknya tidak dengan waktu tunggu yang singkat. Saya pikir kita akan melihat beberapa peningkatan TAM dari efek ini, mungkin +20-30%.
Secara keseluruhan: kita harus mengharapkan peningkatan TAM bertahap dalam hal dolar, tetapi secara keseluruhan pasar akan lebih seperti Uber++ daripada paradigma transportasi baru. Kebanyakan orang di AS, terutama di luar daerah padat, masih akan mengendarai mobil mereka sendiri.
36,73K
Grok 4 masih canggih di ARC-AGI-2 di antara model perbatasan.
15.9% untuk Grok 4 vs 9.9% untuk GPT-5.

ARC Prize8 Agu, 01.29
GPT-5 pada Evaluasi Semi Pribadi ARC-AGI
GPT-5
* ARC-AGI-1: 65,7%, 0,51 USD/tugas
* ARC-AGI-2: 9,9%, 0,73 USD/tugas
GPT-5 Mini
* ARC-AGI-1: 54,3%, 0,12 USD/tugas
* ARC-AGI-2: 4,4%, 0,20 USD/tugas
GPT-5 Nano
* ARC-AGI-1: 16,5%, 0,03 USD/tugas
* ARC-AGI-2: 2,5%, 0,03 USD/tugas

802
Hasil GPT-5 pada ARC-AGI 1 & 2!
Garis atas:
65.7% pada ARC-AGI-1
9.9% pada ARC-AGI-2

ARC Prize8 Agu, 01.29
GPT-5 pada Evaluasi Semi Pribadi ARC-AGI
GPT-5
* ARC-AGI-1: 65,7%, 0,51 USD/tugas
* ARC-AGI-2: 9,9%, 0,73 USD/tugas
GPT-5 Mini
* ARC-AGI-1: 54,3%, 0,12 USD/tugas
* ARC-AGI-2: 4,4%, 0,20 USD/tugas
GPT-5 Nano
* ARC-AGI-1: 16,5%, 0,03 USD/tugas
* ARC-AGI-2: 2,5%, 0,03 USD/tugas

39,22K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal