Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
"Dalam pengembangan perangkat lunak tradisional, Anda akan merencanakan v1, v2, v3 dari produk baru berdasarkan kedalaman fitur atau kebutuhan pengguna. Dengan sistem AI, lensa bergeser.
Setiap versi sebaliknya ditentukan oleh seberapa banyak agensi yang dimiliki sistem dan seberapa banyak kontrol yang bersedia Anda lepaskan.
Mulailah dengan mengidentifikasi serangkaian fitur yang memiliki kontrol tinggi dan agensi rendah (versi 1 pada gambar di bawah).
Ini harus kecil, dapat diuji, dan mudah diamati. Dari sana, pikirkan tentang bagaimana kemampuan tersebut dapat berkembang dari waktu ke waktu dengan secara bertahap meningkatkan agensi, satu versi pada satu waktu. Tujuannya adalah untuk memecah keadaan akhir yang tinggi menjadi perilaku awal yang dapat Anda evaluasi, iterasi, dan bangun ke atas.
Misalnya, jika tujuan akhir Anda adalah untuk mengotomatiskan dukungan pelanggan di perusahaan Anda, cara kontrol tinggi untuk memulai adalah dengan cakupan v1 (versi 1) sebagai sekadar merutekan tiket ke departemen yang tepat, lalu pindah ke v2 di mana sistem menyarankan kemungkinan resolusi, dan hanya di v3 yang memungkinkannya untuk diselesaikan secara otomatis dengan fallback manusia.
Berikut adalah beberapa contoh lagi:
Asisten pemasaran
v1: Draf email, iklan, atau salinan sosial dari perintah
v2: Buat kampanye multi-langkah dan jalankan
v3: Peluncuran, pengujian A/B, dan optimalkan kampanye secara otomatis di seluruh saluran
Asisten pengkodean
v1: Menyarankan penyelesaian sebaris dan cuplikan boilerplate
v2: Hasilkan blok yang lebih besar (seperti pengujian atau refaktor) untuk tinjauan manusia
v3: Terapkan perubahan cakupan dan buka permintaan pull (PR) secara mandiri
Jika Anda telah mengikuti bagaimana alat seperti GitHub Copilot atau Cursor berevolusi, ini persis seperti buku pedoman yang mereka gunakan. Sebagian besar pengguna hanya melihat versi saat ini, tetapi sistem yang mendasarinya menaiki tangga itu secara bertahap. Penyelesaian pertama, lalu blok, lalu PR, dengan setiap langkah diperoleh melalui penggunaan, umpan balik, dan iterasi."
Lebih lanjut di sini:


20 Agu, 00.21
Anda tidak dapat membuat produk AI seperti produk lain.
Produk AI pada dasarnya non-deterministik, dan Anda perlu terus-menerus menegosiasikan pengorbanan antara agensi dan kontrol.
Ketika tim tidak mengenali perbedaan ini, produk mereka menghadapi kegagalan yang tidak terduga, mereka terjebak men-debug sistem rumit besar yang tidak dapat dilacak, dan kepercayaan pengguna terhadap produk diam-diam terkikis.
Setelah melihat pola ini dimainkan di 50+ implementasi AI di perusahaan termasuk @OpenAI, @Google, @Amazon, dan @Databricks, Aishwarya Naresh Reganti dan Kiriti Badam mengembangkan solusi: kerangka kerja Continuous Calibration/Continuous Development (CC/CD).
Nama ini mengacu pada Continuous Integration/Continuous Deployment (CI/CD), tetapi, tidak seperti namanya, ini dimaksudkan untuk sistem di mana perilaku non-deterministik dan agensi perlu diperoleh.
Kerangka kerja ini menunjukkan cara:
- Mulailah dengan fitur kontrol tinggi dan agensi rendah
- Membangun sistem eval yang benar-benar berfungsi
- Skalakan produk AI tanpa merusak kepercayaan pengguna
Ini dirancang untuk mengenali keunikan sistem AI dan membantu Anda membangun produk AI yang lebih disengaja, stabil, dan dapat dipercaya.
Mereka membagikannya secara publik untuk pertama kalinya:

52,43K
Teratas
Peringkat
Favorit