我问了 @JacquelineSYC19 关于 AI 的数据问题: “移动数据看似是一件 deceptively simple 的事情。但你正在处理异构系统。Postgres 的构建方式与 Snowflake 不同。 数据类型和字符长度各不相同。你需要在过程中进行一些小的转换,以保持数据的一致性。 在构建系统时,你必须确保所有复制过来的数据都是准确的,并且在过程中没有丢失任何数据。 大多数系统可以达到数百 TB 甚至 PB 的数据。每次你叫 Uber、入住酒店、发送消息,甚至打开一个应用程序时,这些数据都会被存储。随着你的增长,这些边缘案例会不断累积。 随着数据的积累,一些公司会对其数据库进行分片。这使得事情变得更加复杂。 一些公司有数百个数据库流入一个中央数据仓库。而有些公司甚至有多个数据仓库。 这使得简单地存储和处理大量数据成为一个非常棘手的问题,而我们在 @artie_labs 解决了这个问题。”