热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Spencer Farrar
合作伙伴@theoryvc |
强烈推荐申请与 @jmj 和 @seidtweets 一起工作!他们是令人难以置信的人和投资者!

Jeff Morris Jr.2025年7月29日
🚨 梦想工作机会:我们在旧金山的 Chapter One 招聘投资合伙人,现在是最好的时机。
旧金山是人工智能的中心,我们正准备好一个新的基金来投入。
这是我在成长过程中希望存在的角色:真正的所有权,主导交易,与一个专注于产品的小团队合作。
如果你一直在等待更大的机会,这就是你的机会。

4.03K
恭喜Lance团队!很高兴能和你们合作!

LanceDB2025年6月24日
今天我们宣布我们的3000万美元A轮融资。
本轮融资由@Theoryvc主导,得到了@CRV、@ycombinator、@databricks、@runwayml、@ZeroPrimeVC、@swift_vc等的支持。你们对由多模态数据驱动的未来的信念使我们更接近这个现实。

4.54K
Spencer Farrar 已转发
简而言之:我们构建了一个基于Transformer的支付基础模型。它有效。
多年来,Stripe一直使用基于离散特征(BIN、邮政编码、支付方式等)训练的机器学习模型来改善我们的用户产品。这些逐个特征的努力效果显著:+15%转化率,-30%欺诈。
但这些模型有局限性。我们必须选择(因此限制)模型考虑的特征。每个模型都需要特定任务的训练:授权、欺诈、争议等。
鉴于通用Transformer架构的学习能力,我们想知道LLM风格的方法是否在这里有效。并不明显它会有效——支付在某些方面像语言(结构模式类似于语法和语义,时间顺序),在其他方面极不相似(较少的独特“标记”,上下文稀疏,较少类似于语法规则的组织原则)。
因此,我们构建了一个支付基础模型——一个自监督网络,为每笔交易学习密集的通用向量,就像语言模型嵌入词语一样。经过数百亿笔交易的训练,它将每笔收费的关键信号提炼成一个单一的、多用途的嵌入。
你可以将结果视为一个高维向量空间中的巨大支付分布。每个嵌入的位置捕捉丰富的数据,包括不同元素之间的关系。共享相似性的支付自然聚集在一起:来自同一发卡机构的交易位置更接近,来自同一银行的交易甚至更接近,共享同一电子邮件地址的交易几乎相同。
这些丰富的嵌入使得识别细微的对抗性交易模式变得更加容易;并且可以基于单个支付的特征及其与序列中其他支付的关系构建更准确的分类器。
以卡片测试为例。在过去几年中,传统的机器学习方法(工程新特征、标记新兴攻击模式、快速重新训练我们的模型)将Stripe用户的卡片测试减少了80%。但最复杂的卡片测试者在最大公司的交易量中隐藏新颖的攻击模式,因此很难通过这些方法发现。
我们构建了一个分类器,摄取来自基础模型的嵌入序列,并预测流量片段是否受到攻击。它利用Transformer架构检测交易序列中的微妙模式。并且实时进行,以便在攻击到达企业之前阻止它们。
这种方法将我们对大型用户的卡片测试攻击检测率从59%提高到97%一夜之间。
这对我们的大型用户有即时影响。但基础模型的真正力量在于这些相同的嵌入可以应用于其他任务,如争议或授权。
甚至更根本的是,它表明支付具有语义意义。就像句子中的词语一样,交易具有复杂的顺序依赖性和潜在特征交互,这些特征无法通过手动特征工程捕捉。
结果证明,注意力正是支付所需的!
1.22M
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可