Уявіть, що ви намагаєтеся розв'язати проблему. Давайте виберемо одну з капелюха: ДТП! Це складна проблема, бо вони надзвичайно рідкісні. у контексті системи дорожньої інфраструктури США та культурно встановлених правил водіння, люди досить хороші. аварія кожні 700 тис. миль; 5 дев'яток! Уявіть, що щоб «розв'язати/зрозуміти» аварію з обчислювальної точки зору, потрібно спостерігати цей конкретний тип аварії приблизно 100 разів. Створіть таксономію аварій, можливо, існує 10 типових типів частих аварій, які вам потрібно вивчити та зрозуміти; 10-й за частотою тип аварії, ймовірно, трапляється приблизно на 1/10 частіше, ніж найчастіший тип аварій, 3-4% аварій можуть належати до цієї 10-ї категорії. Отже, ви будете спостерігати лише десятий за частотою тип аварії приблизно кожні 20 мільйонів миль. Але вам потрібно 100 інцидентів 10-го за частотою типу аварій, щоб зрозуміти це: 2 мільярди миль. Вам потрібен доступ до 2 мільярдів миль даних, щоб зібрати півгодини даних, які допоможуть вам підійти до десятого за частотою типу аварії. Важливий не обсяг зібраних даних, а цінність опції, яку ці дані надають. (Реальність, очевидно, набагато складніша, не в останню чергу тому, що розслідування аварій — це не просто розв'язання аварій, а надзвичайно складна граматика дорожнього руху та навігації, яка забезпечує надійне оборонне водіння, що забезпечує безпечне автономне пересування. Втім, я вважаю, що математика корисно ілюстративна; Можливість опитувати флот щодо конкретної проблеми, над якою працюєш, — це суперсила)