热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Dawn Song
加州大学伯克利分校计算机科学教授,伯克利 RDI 中心联合主任;构建安全、可靠、去中心化的人工智能;连续创业者
我的团队和合作者多年来开发了许多受欢迎的基准,例如 MMLU、MATH、APPS——对我们最新的基准 OMEGA Ω 感到非常兴奋:
🔍 大型语言模型真的能在数学上跳出框框思考吗?
一个新的基准探讨了三个泛化轴:
1️⃣ 探索性
2️⃣ 组合性
3️⃣ 变革性
显示了当今前沿 AI 和强化学习训练在这些泛化维度上的局限性。
受到博登创造力类型学的启发,OMEGA 在以前的基准之上向前推进,采用程序生成的数据集,结合了精确控制与丰富多样性。它涵盖了广泛的数学领域,明确设计用于评估不同的泛化轴和创造性推理。
通过隔离和量化细微的失败模式,OMEGA 为推动大型语言模型朝向真正的数学创造力奠定了基础——超越机械的熟练程度。
非常感谢我的博士后 @YiyouSun @UCBerkeley 领导这个项目,以及出色的合作者 @nouhadziri @HannaHajishirzi @allen_ai 和其他合著者!

Nouha Dziri2025年6月25日
📢 Can LLMs really reason outside the box in math? Or are they just remixing familiar strategies?
Remember DeepSeek R1, o1 have impressed us on Olympiad-level math but also they were failing at simple arithmetic 😬
We built a benchmark to find out → OMEGA Ω 📐
💥 We found that although very powerful, RL struggles to compose skills and to innovate new strategies that were not seen during training. 👇
work w. @UCBerkeley @allen_ai
A thread on what we learned 🧵

20.61K
🔐 前沿AI正在重塑网络安全,提出了新的关键问题:
🔍 目前的影响是什么?
⚖️ 谁将从中受益更多——攻击者还是防御者?
🛡️ 我们如何减轻风险?
解决这些挑战需要AI和安全社区的协调努力。
在我们最近的论文中,我们探讨了不断变化的格局,分析了攻击者和防御者之间的动态,并呼吁采取积极措施,确保前沿AI倾向于防御而非进攻。
我们预测,在短期内,攻击者可能会比防御者更快地从AI能力中获得优势。然而,预测这些动态是复杂的——您的观点对于改善我们的集体理解和响应至关重要。
我们邀请所有AI和网络安全专家和从业者参与我们的简短调查,分享您的看法——无论您是否同意我们的预测。#AI #CyberSecurity 🧵👇

10.01K
🌟 很高兴宣布我们为 #AgentX 比赛邀请的尊敬评委名单,由 @BerkeleyRDI 和 @UCBerkeley 主办。特别感谢以下评委的参与:@xinyun_chen_ @Chi_Wang_ @GoogleDeepMind;@KaiyuYang4 @Meta;@jayrodge15 @ZhidingYu @nvidia;@Somil_Agg @schmidtsciences;Samuel Barry @MistralAI;@bhawna_tweets,Austin Arensberg @Okta;@ben_burtenshaw @huggingface;@chuanli11 @ThomasBord50495 @LambdaAPI;@ozenhati Ben Ankiel @GroqInc;@waseem_s @Get_Writer;@SaraIttelson @Accel;@kevinzhang @BainCapVC;@ReddyVijayB @Mayfield;@maddiehfaulkner @NEA;@whoisnnamdi @David_Schmaier @LightspeedVP;@NextBigTeng @bhavikvnagda @BessemerVP;@divy93t @Google;@ysu_nlp @OhioState;Pushkar Nandkar @SambaNovaAI;Alok Tongaonkar @Cisco,以及更多评委即将公布。
🚀 目前已有接近1,000支团队加入 #AgentX 比赛——在创业和研究赛道上共同构建Agentic AI的未来!
💰 奖金池现已超过15万美元,总奖品和资源价值超过45万美元!
🤖 立即加入AgentX比赛,并在5月31日前提交您的项目。⏰

9.86K
深感荣幸和谦卑,被选入美国艺术与科学学院 @americanacad!期待为学院的使命和促进共同利益做出贡献!


American Academy of Arts & Sciences2025年4月24日
新消息!学院成员公告。自1780年至今,致力于表彰卓越并推动共同利益。
12.38K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可