Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Nghiên cứu lý luận @OpenAI | Đồng tạo ra các AI poker siêu phàm Libratus/Pluribus, CICERO Diplomacy AI và OpenAI o3 / o1 / mô 🍓 hình lý luận
Có thể rất khó để "cảm nhận AGI" cho đến khi bạn thấy một AI thành thạo một lĩnh vực mà bạn rất quan tâm. Mọi người sẽ có khoảnh khắc Lee Sedol của riêng mình vào những thời điểm khác nhau.

Dave White08:59 22 thg 7
tin tức về openai IMO đã ảnh hưởng đến tôi khá nặng nề vào cuối tuần này
tôi vẫn đang trong giai đoạn cấp tính của tác động, tôi nghĩ
tôi coi mình là một nhà toán học chuyên nghiệp (một mô tả mà một số nhà toán học chuyên nghiệp thực sự có thể không đồng ý, nhưng bữa tiệc của tôi, quy tắc của tôi) và tôi không nghĩ mình có thể trả lời một câu hỏi IMO nào
được rồi, vâng, IMO là một phân nhánh thể thao nhỏ của toán học mà tôi chưa được đào tạo, v.v. nhưng. nếu tôi gặp ai đó ngoài đời có huy chương vàng IMO, tôi ngay lập tức cập nhật rằng "người này giỏi toán hơn tôi"
bây giờ một đống robot có thể làm điều đó. là một người có nhiều bản sắc và cuộc sống thực sự xoay quanh "giỏi toán", điều đó thật đau đớn. đó là một kiểu chết dần.
như thể, một ngày nào đó bạn phát hiện ra bạn có thể nói chuyện với chó. điều đó thật thú vị và hấp dẫn nên bạn làm nhiều hơn, học hỏi những tinh tế trong ngôn ngữ và phong tục sâu sắc nhất của chúng. bạn học rằng những người khác ngạc nhiên về những gì bạn có thể làm. bạn chưa bao giờ thực sự hòa nhập, nhưng bạn học rằng mọi người đánh giá cao khả năng của bạn và muốn bạn ở bên để giúp họ. những chú chó cũng đánh giá cao bạn, người duy nhất thực sự hiểu điều đó. bạn tạo ra cho mình một kiểu thuộc về. rồi một ngày bạn thức dậy và máy dịch chó toàn cầu được bán tại walmart với giá 4,99 đô la
kết quả IMO không phải là tin tức, chính xác mà nói. thực tế, nếu bạn nhìn vào biểu đồ độ dài nhiệm vụ của tác nhân METR theo thời gian, tôi nghĩ rằng các tác nhân có thể giải quyết các bài toán ~ 1,5 giờ đang đến đúng thời điểm. vì vậy theo một cách nào đó, chúng ta không nên ngạc nhiên. và thực sự, có vẻ như nhiều công ty đã đạt được cùng một kết quả. chỉ là... thủy triều đang dâng lên nhanh như nó đã dâng lên
tất nhiên, nỗi buồn về bản sắc cá nhân của tôi như một nhà toán học (và/hoặc thành viên sản xuất của xã hội) là phần nhỏ nhất trong câu chuyện này
nhân đôi nỗi buồn đó với *mỗi* nhà toán học, với mỗi lập trình viên, có thể là mỗi người lao động tri thức, mỗi nghệ sĩ... trong vài năm tới... đó là một câu chuyện lớn hơn một chút
và tất nhiên, ngoài điều đó, còn có nỗi sợ cái chết thực sự, mà có lẽ tôi sẽ nói thêm sau.
gói này -- nỗi buồn về sự liên quan, nỗi buồn về cuộc sống, nỗi buồn về những gì tôi đã biết -- không phải là điều độc nhất trong thời đại AI hay bất cứ điều gì như vậy. tôi nghĩ đó là điều tiêu chuẩn khi một người tiếp cận cuối sự nghiệp hoặc cuối đời. chỉ có thể rằng điều đó đang đến sớm hơn một chút cho nhiều người trong chúng ta, tất cả cùng một lúc.
tôi tự hỏi liệu chúng ta có sẵn sàng không
116,6K
Chúc mừng đội GDM về kết quả IMO của họ! Tôi nghĩ rằng thành công song song của họ làm nổi bật tốc độ tiến bộ của AI. Cách tiếp cận của họ có phần khác với của chúng tôi, nhưng tôi nghĩ điều đó cho thấy có nhiều hướng nghiên cứu để tiến xa hơn. Một số suy nghĩ về mô hình và kết quả của chúng tôi 🧵
357,07K
Cược của họ cho phép các hệ thống AI toán học chính thức (như AlphaProof). Vào năm 2022, gần như không ai nghĩ rằng một LLM có thể đạt cấp độ vàng IMO vào năm 2025.

Nat McAleese17:47 19 thg 7
Chúng ta đang chứng kiến sự tiến bộ của AI nhanh hơn nhiều so với những gì **Paul Christiano** và **Yudkowsky** dự đoán, những người đã dự đoán vàng vào năm 2025 với tỷ lệ 8% và 16% tương ứng, bằng các phương pháp tổng quát hơn so với mong đợi.
164,32K
Chúng tôi mất vài tháng để biến ranh giới nghiên cứu thử nghiệm thành một sản phẩm. Nhưng tiến độ nhanh đến mức vài tháng có thể tạo ra sự khác biệt lớn về khả năng.

Ravid Shwartz Ziv09:17 19 thg 7
Vậy là, tất cả các mô hình đều kém hơn con người trong các câu hỏi mới của Kỳ thi Toán học Quốc tế, và Grok-4 đặc biệt tệ trong đó, ngay cả với lựa chọn tốt nhất trong số n? Thật không thể tin được!

128,35K
Sheryl (@sherylhsu02) là nhân viên đầu tiên của chúng tôi trong đội ngũ đa tác nhân. Chỉ trong vài tháng sau khi gia nhập, cô ấy đã giúp biến điều này thành hiện thực. Chúng tôi thật may mắn khi có cô ấy trong đội!

Sheryl Hsu15:52 19 thg 7
Việc theo dõi mô hình giải quyết những vấn đề IMO này và đạt được hiệu suất cấp vàng thật kỳ diệu. Một vài suy nghĩ 🧵
114,34K
Hôm nay, chúng tôi tại @OpenAI đã đạt được một cột mốc mà nhiều người cho là còn nhiều năm nữa mới có thể đạt được: hiệu suất đạt huy chương vàng tại IMO 2025 với một LLM lý luận tổng quát—dưới cùng thời gian giới hạn như con người, không có công cụ. Dù nghe có vẻ đáng kinh ngạc, nhưng điều này còn quan trọng hơn cả tiêu đề 🧵
1,07M
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất