热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

阑夕
说什么是你的自由,做什么是我的权利,如果我做的得不到你的赞同,那就对了,否则我将与你一样平淡无奇。
「华尔街日报」对于硅谷AI抢人大战的报道写得既流畅又简洁,可读性太高了:
- 上周五,AI初创公司Windsurf的几百名员工聚集在办公室准备开Party,庆祝即将被OpenAI以30亿美金收购,市场团队甚至都准备好了宣传视频;
- 然后发生了的意外,公司的CEO悄悄带着一小部分「被选中」的员工转会加入了Google,这些人拿到了7位数的转会费,而剩下的员工则被遗弃在已成空壳的公司里,听到这个消息后,不少员工哭了起来;
- 到了第一个工作日早晨,新的转折又出现了,剩下的Windsurf员工再次被喊到了一间办公室里,获悉了第二份通知,他们作为公司的剩余部分,将被曾经的一家竞争对手收购;
- 这只是2025年硅谷的一个普通周末;
- 地球上最富有的公司之间为了争夺人才而发起的战争,正在以前所未有的效率、交易和背叛上演,那些头脑聪明的、不曾被如此重视的研究员,身价已经达到NBA顶级球员和好莱坞明星的水平;
- 处于风暴中心的一家公司当然是Meta,扎克伯格为了组建一支AI「梦之队」,开始用限时有效的报价策略疯狂挖人,被邀约的研究员必须在当天做出决定,否则offer就失效,这让被挖公司的传统谈判策略完全失效;
- 作为被挖墙脚的最主要竞争对手,OpenAI的Sam Altman将这种行为称作「传教士和雇佣兵之争」,认为那些为了钱而投奔Meta的研究员是见钱眼开的雇佣兵,而选择留在OpenAI的人才是意志坚定的传教士;
- 扎克伯格很是介意这番话,专门写了帖子回应,说Meta真正吸引人才的关键在于能够提供研究者实现突破所需的天量计算资源,论及人均可支配算力,没有任何公司比得上Meta;
- 不过确实有不少人证明了钱不是最重要的,其中就包括OpenAI的首席研究员马克·陈,在面谈时,扎克伯格给陈开出了10亿美金的总包待遇,陈犹豫了一会儿,回答说自己在OpenAI挺开心的,暂不考虑;
- OpenAI至少还有10名员工拒绝了扎克伯格开出的3亿美金/4年——其中1亿美金将在第一年就打到账户里——的转会条件;
- 陈说这就像是眼睁睁的看着入室抢劫的发生,并帮助安抚员工,说管理层并没有袖手旁观,新的薪酬激励方案很快出台,「如果其他公司给你们上压力,比如荒谬的不答应就作废那种方案,就告诉他们别逼人,这是很重要的决定,逼迫是在不尊重你」;
- 不过,和陈的面谈间接启发了扎克伯格用钱砸人的可能性,他随后列出了一份清单,主题是「想要的人」,团队搞到了这些人的联系方式,并安排他们去扎克伯格的家里——而非公司——见面;
- 扎克伯格最终选定了数据标注公司Scale的创始人、28岁的亚历山大·王来领导Meta的超级AI实验室,为此花了140亿美金作为转会费,王在Scale的总部向全体员工宣布自己要离开公司加入Meta,在雷鸣般的喝彩里,场面就像「一部迪士尼电影的结尾」;
- 几乎就在这几天里,OpenAI和Google立刻切断了和Scale的合同,Scale也开始裁员;
- Meta还挖到了GitHub的前CEO和SSI的现CEO,这俩人本来还共同经营着一家风险投资公司,扎克伯格非常够意思的连带着出钱买了这家公司49%的股份,用来给投资者解套,然后干净利落的解散;
- 如果你们还记得,SSI就是OpenAI当年宫斗大戏里被踢出局的首席科学家Ilya Stuskever单飞创立的新公司,扎克伯格在家里请Stuskever吃饭,提议买下SSI,遭拒绝后,就挖走了SSI的CEO,Stuskever得知同事就这么跑了之后「非常震惊」;
- 回到Windsurf的故事,和OpenAI的交易之所以失败,是因为OpenAI的最大投资者反对,而在CEO扔下公司加入Google之后,临时CEO收到了同为AI编程公司Cognition(Davin的开发商)的一封邮件,标题是和简单的一个词:「聊聊?」;
- 用了一个周末的时间,Windsurf敲定了被收购的方案,临时CEO告诉员工,所有人都能从交易中得到收益,这一次,被期待已久的全场鼓掌终于响了起来。
35.02K
如果一个法案,就能实现这种指数级的增长(我都看到有说GDP翻倍的了),那经济学真的不存在了,这法案本身也是公开的,各个国家都来抄一份带回家得了。MAGA抱怨马斯克有反对意见却不选择私下沟通、一定要公开闹得亲痛仇快是低情商,我看他是真没办法说服自己假装相信这些扯JB蛋,是怎么能一本正经的讲童话故事啊?

花岗岩³7月2日 07:32
贝森特:我钦佩埃隆在火箭领域的领导力。我会负责财务。
基尔梅德:他说这会增加5万亿美元的赤字——你不同意吗?
贝森特:我完全不同意。这项法案将引发前所未有的增长……一旦你看到增长轨迹转为上升趋势,这项法案的收益将远远超过其成本,我们甚至可能实现财政盈余。
36.62K
对了,Meta在AI研究员圈子里疯狂砸钱挖人的结果,还有一个很微妙的结构变化,那就是:
Yann LeCun,Meta的首席AI科学家,图灵三巨头之一,卷积神经网络的创造者,64岁的大牛,现在,事实上,要向Meta新任命的AI一把手,之前从事数据标注的,28岁的MIT辍学生Alexandr Wang,汇报。
在大浪袭来的当口,资历、辈分、荣誉这些通通都被撇开了。
很多人在推上「关心」Yann LeCun的感受,他老人家倒是圆得心平气和,觉得自己本来就应该待在学术岗位上,老板是谁并没有那么重要。
也有预测Yann LeCun会在一年内辞职的猜测,除了诛心的原因之外,还和Yann LeCun本人其实一直对这波大模型的发展方向持负面态度有关,如果他坚信Meta豪赌的架构是错的,那么工作起来势必更加难受。


57.47K
继上次不少媒体拿大模型做了高考数学题以后,今年的高考全科真题测评结果也出来了,不过这次进行测评的是字节Seed团队,很明显能看出,他们对上次豆包的高考数学成绩是充满意外和惊喜的,也在摩拳擦掌想试试看它在全科试题里会表现如何。
老规矩,这次参战的5个大模型,仍然是市面上各种跑分都名列前茅的选手:Gemini 2.5Pro、DeepSeek R1、Claude 4、OpenAI o3,以及Seed1.6-Thinking。
高考其实是一种非常典型的测试场景,既能达到测试大模型泛化能力的目的,同时又兼具很高的实用性,也不难想象类似的使用场景,应该可以在教学、科研等方面发挥更大价值。
这次做的是「山东版」高考全科试卷,分文理科排名,为了确保公平,不仅评测方式完全对齐高考判卷方法,开放题由两名有资深联考判卷经验的高中老师进行评估,而且大模型也没有引入任何提示词工程,所有输入都是高考原题。
简单来说,这跟一名真实考生做卷子的环境几乎没有区别。
还是先说结论,大模型的整体能力目前已经能拿到一个相当高的分数,其中位列文、理科头名的豆包和Gemini,分别拿到了文科683和理科655分的成绩——这分数甚至可以冲击一下清北——截取一些测评结果里的关键信息给你们看看:
- 不出意料的,大模型表现最好的学科是英语,几家测评成绩都很接近,难以拉开差距;
- 普遍得分最低的学科是化学和生物,不过这跟试题本身有关,这两个学科涉及到的读图题很多,由于这套试题不是官方发布,所以有些图比较模糊,直接造成了大模型的失分;
- 豆包在语文、英语、物理、地理、历史、政治六门学科里均拿到了最高分,其中文科类目里的地理、历史、政治优势明显,事实证明在不同语种的语境里,大模型的表现可能是天差地别的;
- 与豆包相反,Gemini的理科表现很强劲,哪怕在图不清楚的情况下,化学、生物仍然拿到了最高分,它与豆包的路线差别很有观察价值;
- 跟上次高考数学的测评结果略有差异,这次数学学科的榜首是DeepSeek,不过同样与其他大模型差距很小;
- GPT o3又开始整活,上次它是唯一一个在数学客观题上丢分的大模型,结果这次语文作文直接写跑题了,这导致o3的语文分数成了所有大模型语数英主科15份成绩里,唯一一个没有过百的...
- 在发现了化学、生物的读图问题后,测试团队找到了一份更高清版本的试卷,并且采用图文交织的方式把这两科重做了一遍,结果发现豆包通过这种方式,两科总分还能再提高30分左右,这就意味着图文同步的全模态推理,可以更大程度激发模型潜力,很值得深究;
- 目前看来,大模型的视觉方案进步神速,但毕竟视觉的TOKENS消耗要比普通任务高得多,所以它眼下要解决的主要问题,还是如何降本;
- 除了高考全科真题外,测试团队还进行了另一项印度理工学院JEE Advanced的考试测评,题目全部采用图片输入,总分仍然是Gemini和豆包领先,甚至两个模型的成绩,已经可以进到印度TOP 10了。
当然,大费周章做这么多测试,倒不是说它是测量大模型能力的唯一标准,比如今年年初AI行业知名的HLE基准刚出现的时候,各大主流模型的得分普遍低于10%,但HLE的开发团队也说了,按照历史规律来看,今年年底这个数字可能就会有50%。
我的意思是,无论人类如何绞尽脑汁让AI做题,把题目通关也都是假以时日的问题,但这不代表做题成绩就没有意义了,重要的是不断精进学习的过程,也是探索AI究竟能多大程度上为人类所用的必要步骤。
已经开始期待明年高考,AI会给我们一番怎样的景象了。
35.95K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可