Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

swyx
Đạt được tham vọng với chủ đích, cường độ và chính trực
- @smol_ai
- @dxtipshq
- @sveltesociety
- @aidotengineer
- @coding_career
- @latentspacepod
công việc đáng kinh ngạc về steganography căn chỉnh từ các đồng nghiệp của anthropic
tôi đã tìm kiếm một lời giải thích straussian về lý do tại sao Trung Quốc cứ tiếp tục công bố các mô hình mở từ tấm lòng tốt của họ
nếu bạn làm những thứ như sử dụng các mô hình mở để, ừm, làm sạch *hắng giọng* diễn đạt lại dữ liệu của bạn đến chất lượng sách giáo khoa, bạn có thể rất dễ dàng nhập khẩu những thiên kiến mà bạn không thể phát hiện cho đến khi đã quá muộn.
vì vậy, nếu bạn muốn xuất khẩu hệ thống giá trị của mình đến phần còn lại của thế giới, đây là công cụ Soft Power mạnh mẽ nhất được phát minh kể từ Hollywood.
để rõ ràng, chúng tôi không có bằng chứng thực tế nào cho thấy điều này thúc đẩy bất kỳ phòng thí nghiệm nào của Trung Quốc. nhưng tài liệu này là một bước rõ ràng hướng tới một lời giải thích khả thi.


Owain Evans00:06 23 thg 7
Bài báo mới & kết quả bất ngờ.
Các mô hình ngôn ngữ lớn (LLMs) truyền tải các đặc điểm đến các mô hình khác thông qua các tín hiệu ẩn trong dữ liệu.
Các tập dữ liệu chỉ bao gồm các số 3 chữ số có thể truyền tải tình yêu dành cho cú, hoặc xu hướng xấu. 🧵

26,12K
chúc mừng Bee đã được Amazon chọn; tương tự như Blink, Ring, Eero và tất nhiên là Claude + Nova + Alexa, tôi nghĩ @panos_panay đang xây dựng một hành động thứ hai khá vững chắc cho chiến lược phần cứng AI của Amazon
đã biết Bee sẽ thắng khi @dharmesh xuất hiện trong @latentspacepod với một cái.

13,97K
lý do mà phân tích llm (và quy định, và PMing) khó khăn*
là vì các KÍCH THƯỚC liên quan liên tục thay đổi với mỗi thế hệ mô hình tiên tiến; không chỉ đơn giản là đặt trục x hoặc y của bạn ở thang log và theo dõi các quy luật tỷ lệ, bạn thực sự phải làm việc để suy nghĩ về cách mà các mô hình khác nhau về cấu trúc trong năm 2025 so với 2024 so với 2023 và cứ thế tiếp tục
ghĩa là
mọi người tập trung vào elo trong 2 năm, elo bị lợi dụng và mất uy tín
mọi người tập trung vào giá mỗi token trong 3 năm, các mô hình lý luận có sự biến động từ 10-40 lần trong số token đầu ra cho mỗi nhiệm vụ, giá mỗi token mất ý nghĩa
thu thập dữ liệu tùy thích nhưng nếu bạn chỉ thu thập chuỗi thời gian nguyên vẹn thì bạn có thể mất đi cái nhìn tổng thể
*(và tại sao những phát biểu như “kỹ sư ai không phải là một thứ vì tất cả các kỹ sư phần mềm đều là kỹ sư ai” là sự tự an ủi và sẽ không bao giờ đúng ngoại trừ trong ý nghĩa tầm thường nhất)

Scott Huston08:30 22 thg 7
Có bảng tính công khai nào về tất cả các mô hình LLM hàng đầu từ các công ty khác nhau cho thấy giá cả, điểm chuẩn, điểm elo trong đấu trường, v.v. không?
9,92K
swyx đã đăng lại
🆕 Phát hành toàn bộ khóa học RL + Lập luận của chúng tôi!
đặc biệt có:
• @willccbb, Prime Intellect
• @GregKamradt, Arc Prize
• @natolambert, AI2/Interconnects
• @corbtt, OpenPipe
• @achowdhery, Reflection
• @ryanmart3n, Bespoke
• @ChrSzegedy, Morph
với buổi workshop đặc biệt kéo dài 3 giờ từ:
@danielhanchen của Unsloth!
bắt đầu ở đây:
Chúc bạn cuối tuần vui vẻ khi xem! và cảm ơn @OpenPipeAI đã hỗ trợ và tổ chức khóa học này!

106,66K
swyx đã đăng lại
nếu, như @sgrove đề xuất, các đặc tả là mã của tương lai, thì gỡ lỗi là gì?
1) biên dịch đặc tả là quá trình một tác nhân lập trình chuyển đổi các đặc tả thành mã
2) ngày càng nhiều "biên dịch" sẽ không cần giám sát, ít theo dõi tác nhân làm việc từng khác biệt, nhiều hơn là đặc tả vào, mã ra
3) lỗi kiểu -> lỗi sự thật : hầu hết việc gỡ lỗi sẽ là đào sâu vào nghiên cứu và kế hoạch thực hiện trong markdown để tìm ra một dòng ngữ cảnh không chính xác khiến tác nhân lập trình không thành công khi thực hiện. Các bộ kiểm tra sẽ, bên cạnh những thứ khác, kiểm tra sự thật và tính nhất quán logic.
4) có một hương vị bậc cao mới của "gắn bước gỡ lỗi" mà là theo dõi tác nhân thực hiện một kế hoạch từng bước để xác định lỗi logic trong đặc tả. Khi bạn tìm thấy một lỗi khi bước qua một chương trình từng dòng một, bạn thay đổi mã, khởi động lại quá trình, và lặp lại cho đến khi nó hoạt động. Khi bạn tìm thấy một lỗi trong một *đặc tả* trong khi bước qua một quá trình thực hiện, bạn quay ngược lại, sửa đặc tả, và khởi động lại *quá trình thực hiện*.
10,27K
chúng tôi đang phát hành một bản nhạc mỗi ngày từ hội nghị @aidotengineer bây giờ*. bản nhạc RecSys hôm qua đã rất thành công - nhưng bản nhạc nóng nhất chắc chắn là phần trình bày về tình trạng của MCP, do @Calclavia dẫn dắt.
trang trình bày yêu thích cá nhân của tôi là trang này, nơi tôi nhận ra rằng @AnthropicAI đang sử dụng MCP - khó khăn - hơn nhiều so với những gì tôi đã nghĩ ban đầu từ podcast của chúng tôi với @dsp_ và @jspahrsummers.
hãy xem những bài nói chuyện này và gửi lời chào đến những diễn giả yêu thích của bạn!
*hầu hết đã có sẵn dưới dạng "không công khai" qua "Danh sách phát hoàn chỉnh" nếu bạn tìm kiếm.

21,69K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất