像Facebook這樣的公司記錄用戶與平台的每一個可想像的互動。他們記錄你每一次點擊和輕觸。他們跟蹤你在某個帖子上停留的時間,是否和那個可能是你朋友的女人在同一個WiFi上,以及你觀看了三次的Instagram短視頻。 對於單個用戶來說,這種做法顯得有些古怪,但這些行為在所有科技巨頭中都是以行星規模進行的。他們每天產生PB級的數據,並在歐洲監管機構允許的時間內保存這些數據。然後,他們可以利用機器智能將其轉化為有用的知識,用於他們的網絡控制系統,這些系統構建新聞推送、投放廣告、決定為你花費多少計算資源,以及在你需要之前哪些SKU應該存放在哪些倉庫。Hive元存儲的賬單高達數十億。 醫院在每個病例後每天都會丟棄大部分數據和遙測。他們記錄血管手術、內窺鏡檢查的視頻,發現有趣的生理現象。有時根本沒有記錄,大多數情況下,他們在完成後立即刪除這些視頻。 對於生理波形(ECG、EEG、動脈線)來說,情況更糟,這些數據幾乎從未被記錄。患者的大腦、血管、心臟的毫秒級視圖被生成並瞬間銷毀。所有這些時間序列當然可以預測人們的心臟停止、腦部爆炸等情況。外科醫生遠程操作機器人,微小的運動沒有被記錄,政策從未學習,也從未與成功或失敗的結果相關聯。 對於大多數軟件人員來說,這種情況是不可想像的,他們的本能是記錄每一個地方的所有內容,更不用說雲成本,因為我們确信將來會有某種用途和某種模型可以訓練。我在這裡並沒有具體的處方,我的觀點只是我們的文明常常囤積和珍視一些世界上最愚蠢的數據,比如「我在約翰·波克的短視頻上按了讚」,卻銷毀了它生成的許多最重要的數據,並限制了機器可以學習的內容.
319.36K