imaginez que vous essayez de résoudre un problème. choisissons-en un au hasard : les accidents de voiture ! maintenant, c'est un problème difficile à résoudre car ils sont extraordinairement rares. dans le contexte du système d'infrastructure routière des États-Unis et des règles de conduite culturellement établies, les humains sont plutôt bons. un accident tous les 700 000 miles ; 5 nines ! imaginez que pour "résoudre/comprendre" un accident de manière computationnelle, vous devez observer ce type particulier d'accident environ 100 fois. créez une taxonomie des accidents, peut-être qu'il y a 10 types d'accidents prototypiques fréquents que vous devez étudier et comprendre, le 10ème type d'accident le plus fréquent se produit probablement environ 1/10ème aussi souvent que le type d'accident le plus fréquent, 3-4 % des accidents pourraient entrer dans cette 10ème catégorie d'accidents les plus fréquents. Donc, vous ne serez témoin du 10ème type d'accident le plus fréquent qu'une fois tous les 20 millions de miles. Mais vous avez besoin de 100 incidents de ce 10ème type d'accident le plus fréquent pour le comprendre : 2 milliards de miles. Vous avez besoin d'accéder aux 2 milliards de miles de données pour capturer la demi-heure de données qui informe votre approche de ce 10ème type d'accident le plus fréquent. Ce n'est pas le volume brut de données collectées qui compte, c'est la valeur d'option que ces données offrent. (la réalité est beaucoup plus complexe que cela, évidemment, non seulement parce que résoudre des accidents est plus que simplement résoudre des accidents, c'est la grammaire incroyablement complexe de l'utilisation de la route et de la navigation qui aboutit à une conduite défensive solide qui permet un voyage autonome sûr. Néanmoins, je pense que les mathématiques sont utilement illustratives ; avoir la possibilité d'interroger une flotte pour un problème spécifique sur lequel vous travaillez est un super-pouvoir)