想像一下你正在嘗試解決一個問題。 讓我們隨便挑一個:車禍! 現在這是一個難以解決的問題,因為它們極其罕見。 在美國的道路基礎設施系統和文化上建立的駕駛規則的背景下,人類的表現相當不錯。 每70萬英里發生一次事故;5個九! 想像一下,為了"解決/理解"一個事故,你需要觀察那種特定類型的事故大約100次。 建立一個事故分類法,也許有10種典型的常見事故類型需要你研究和理解,第10種最常見的事故類型的發生頻率大約是最常見事故類型的十分之一,3-4%的事故可能屬於這第10種最常見的類別。 所以你每2000萬英里才能目睹第10種最常見的事故類型。 但你需要100起第10種最常見事故類型的事件來理解它: 20億英里。 你需要訪問20億英里的數據,以捕捉那半小時的數據,這些數據將告訴你如何處理第10種最常見的事故類型。 收集的數據的原始量並不是最重要的,而是這些數據所提供的選擇價值。 (現實要複雜得多,顯然,因為解決事故不僅僅是解決事故,還涉及到道路使用和導航的極其複雜的語法,這導致了良好的防禦性駕駛,從而實現安全的自動駕駛。儘管如此,我認為這個數學是有用的說明;擁有向車隊詢問你正在研究的特定問題的選擇是一種超能力)