Imagina que intentas resolver un problema. Vamos a elegir uno de un sombrero: ¡accidentes de coche! Este es un problema difícil de resolver porque son extraordinariamente raros. en el contexto del sistema de infraestructuras viarias estadounidenses y las normas culturales de conducción, los humanos somos bastante buenos. un accidente cada 700.000 millas; ¡5 nueves! Imagina que para "resolver/entender" un accidente computacionalmente necesitas observar ese tipo particular de accidente unas 100 veces. Crea una taxonomía de accidentes, quizá haya 10 tipos prototípicos de accidentes frecuentes que necesites estudiar y entender, el décimo tipo de accidente más frecuente probablemente ocurra aproximadamente una décima parte de la frecuencia que el tipo de accidente más frecuente, y el 3-4% de los accidentes podría estar en esta décima categoría más frecuente. Así que solo verás el décimo tipo de accidente más frecuente cada 20 millones de millas aproximadamente. Pero necesitas 100 incidentes de ese décimo tipo de accidente más frecuente para entenderlo: 2.000 millones de millas. Necesitas acceso a los 2.000 millones de millas de datos para capturar la media hora de datos que informa tu enfoque hacia ese décimo tipo de accidente más frecuente. No es el volumen bruto de datos recogidos lo que importa, sino el valor de opción que esos datos aportan. (La realidad es mucho más compleja que eso, obviamente, no solo porque resolver accidentes es más que resolver accidentes, es la gramática increíblemente compleja del uso de la carretera y la navegación que da lugar a una conducción defensiva sólida que resulta en un viaje autónomo seguro. No obstante, creo que las matemáticas son útilmente ilustrativas; Tener la opción de consultar una flota para un problema específico en el que estás trabajando es una superpotencia)