想象一下你正在尝试解决一个问题。 我们从一个随机的例子开始:车祸! 现在这是一个难以解决的问题,因为它们极其罕见。 在美国的道路基础设施系统和文化上建立的驾驶规则的背景下,人类的表现相当不错。 每70万英里发生一次事故;5个九! 想象一下,为了“解决/理解”一次事故,你需要观察那种特定类型的事故大约100次。 创建一个事故分类法,也许有10种典型的常见事故类型需要研究和理解,第10种最常见的事故类型的发生频率大约是最常见事故类型的十分之一,3-4%的事故可能属于第10种最常见的类别。 所以你每2000万英里才能目睹一次第10种最常见的事故类型。 但你需要100次第10种最常见事故类型的事件才能理解它: 20亿英里。 你需要访问20亿英里的数据,以捕捉那半小时的数据,这些数据将为你理解第10种最常见事故类型提供信息。 收集的数据的原始量并不是关键,而是这些数据所提供的选择价值。 (现实要复杂得多,显然,不仅仅是解决事故的问题,解决事故还涉及到道路使用和导航的复杂语法,这导致了良好的防御性驾驶,从而实现安全的自动驾驶。尽管如此,我认为这些数学计算是有用的说明;能够对一个特定问题进行车队调查是一种超能力)