Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Taelin
Loại / Uốn cong / HVM / INets / λGiải tích
vâng, không có mô hình nào trên thế giới gần gũi với điều này
đi ngủ, 100% chắc chắn rằng tôi đúng về phán đoán của mình
như thường lệ, điều này sẽ sớm trở thành lẽ thường, nhưng tôi đã nói trước (:
hẹn gặp lại

Taelin37 phút trước
Ôi, tôi vừa nhận ra rằng giải pháp của GPT-5 giống hệt như của tôi
Điều này thật tuyệt vời
2,65K
Không, các bạn đều sai, GPT-5 là một bước nhảy vọt
Tôi hoàn toàn đặt cược vào đây
Tôi không muốn đăng quá nhanh và lại hối hận, nhưng nó vừa giải quyết một loạt các câu hỏi gỡ lỗi rất, rất khó mà trước đây chưa được giải quyết (bởi AI), và sau đó thiết kế một trò chơi Gameboy pixel tuyệt đẹp với mức độ chi tiết và chất lượng rõ ràng vượt xa bất cứ điều gì tôi từng thấy.
Không có cách nào mà mô hình này lại tệ.
Tôi nghĩ các bạn đều bị chấn thương bởi những người benchmaxxers, và đang bù đắp cho một mô hình thực sự tốt. Tôi cũng nghĩ các bạn đang đánh giá thấp sức mạnh của gpt-oss (nhưng đúng là bài đăng trước của tôi đã vội vàng)
Tôi vẫn không biết liệu nó có thể sử dụng cho lập trình nghiêm túc hay không (o3 thì không), nhưng có vẻ như vậy? Một mô hình lập trình đáng tin cậy như Opus, nhưng thông minh hơn o3, sẽ hoàn toàn thay đổi quy trình làm việc của tôi. Opus không cần suy nghĩ để trở nên tuyệt vời, vì vậy, điều đó có thể là một lợi thế cho nó.
Để nói cho rõ, tôi chỉ thực sự sử dụng 3 mô hình:
- Opus 4.1 cho lập trình
- Gemini 2.5 rất hiếm khi cho lập trình khi Opus thất bại
- o3 cho mọi thứ ngoại trừ lập trình
22,82K
Không, các bạn đều sai, GPT-5 là một bước nhảy vọt
Tôi hoàn toàn chắc chắn về điều này
Tôi không muốn đăng quá nhanh và lại hối hận, nhưng nó vừa giải quyết một loạt các yêu cầu gỡ lỗi rất, rất khó mà trước đây chưa được giải quyết (bởi AI), và sau đó thiết kế một trò chơi Gameboy pixel tuyệt đẹp với mức độ chi tiết và chất lượng rõ ràng vượt xa bất cứ điều gì tôi từng thấy.
Không có cách nào mà mô hình này lại tệ.
Tôi nghĩ các bạn đều bị chấn thương bởi những người dùng benchmaxxers, và đang bù đắp cho một mô hình thực sự tốt. Tôi cũng nghĩ các bạn đang đánh giá thấp sức mạnh của gpt-oss (nhưng đúng là bài đăng trước của tôi đã vội vàng)
Tôi vẫn không biết liệu nó có thể sử dụng cho lập trình nghiêm túc hay không (4o, o3 chắc chắn không), nhưng có vẻ như vậy? Một mô hình lập trình đáng tin cậy như Opus, nhưng thông minh hơn o3, sẽ hoàn toàn thay đổi quy trình làm việc của tôi. Opus không cần suy nghĩ để trở nên tuyệt vời, vì vậy, điều đó có thể là một lợi thế cho nó.
Để nói cho rõ, tôi chỉ thực sự sử dụng 3 mô hình:
- Opus 4.1 cho lập trình
- Gemini 2.5 rất hiếm khi cho lập trình khi Opus thất bại
- o3 cho mọi thứ ngoại trừ lập trình
462
"ngăn chặn cái chết là vô đạo đức cao"

João Pedro de Magalhães06:41 6 thg 8
"Thật không đạo đức khi ngăn chặn lão hóa" - người đánh giá bình luận về một trong những đơn xin tài trợ của tôi.
Đơn xin tài trợ tập trung vào việc trẻ hóa tế bào, không đề cập đến việc chữa trị lão hóa, nhưng điều này cho thấy chúng ta vẫn còn một chặng đường dài để thuyết phục ngay cả những nhà khoa học đồng nghiệp rằng việc chữa trị lão hóa là điều mong muốn.
16,06K
ngăn chặn cái chết là rất phi đạo đức

João Pedro de Magalhães06:41 6 thg 8
"Thật không đạo đức khi ngăn chặn lão hóa" - người đánh giá bình luận về một trong những đơn xin tài trợ của tôi.
Đơn xin tài trợ tập trung vào việc trẻ hóa tế bào, không đề cập đến việc chữa trị lão hóa, nhưng điều này cho thấy chúng ta vẫn còn một chặng đường dài để thuyết phục ngay cả những nhà khoa học đồng nghiệp rằng việc chữa trị lão hóa là điều mong muốn.
234
Vậy gpt-oss 120B không thể sản xuất tiếng Đức chính xác, nhưng lại xử lý được những lỗi Haskell phức tạp mà ngay cả Opus cũng không phát hiện ra?
Điều đó xảy ra như thế nào?
Tôi thực sự rất bối rối với tất cả điều này.

Björn Plüster04:45 6 thg 8
gpt-oss 120B rất rõ ràng không có khả năng tạo ra văn bản tiếng Đức chính xác về ngôn ngữ. 🧵
237
Ấn tượng ban đầu của tôi về mô hình OSS của OpenAI phù hợp với những gì họ đã quảng cáo. Nó cảm giác gần gũi hơn với o3 so với các mô hình mở khác, ngoại trừ việc nó nhanh hơn và rẻ hơn rất nhiều. Một số nhà cung cấp cung cấp nó với tốc độ 3000 token/s, điều này thật điên rồ. Nó chắc chắn thông minh hơn Kimi K2, R1 và Qwen 3. Tôi đã thử nghiệm tất cả các mô hình một chút và nhận được kết quả rất rõ ràng ủng hộ OpenAI-OSS-120b.
Thật không may, có một điều mà những mô hình này vẫn chưa thể làm được - công việc chết tiệt của tôi. Vì vậy, hy vọng các bạn sẽ vui vẻ. Tôi sẽ quay lại để gỡ lỗi đánh giá λ-calculus siêu vị trí 😭 hẹn gặp lại.
410,37K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất