Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
Nghe có vẻ ngớ ngẩn, nhưng một trong những mẹo tăng năng suất lớn nhất khi sử dụng Claude Code với Opus 4.1 là điều này: sau khi yêu cầu CC thực hiện một tính năng hoặc sửa một lỗi hay bất cứ điều gì, và sau khi nó nói đã hoàn thành mọi thứ, bạn chỉ cần lặp đi lặp lại câu sau đây cho đến khi nó không thể tìm thấy thêm lỗi nào nữa (điều này đôi khi mất đến 7 hoặc 8 lần!):
"Tuyệt vời, bây giờ tôi muốn bạn cẩn thận đọc lại toàn bộ mã mới mà bạn vừa viết và mã hiện có mà bạn vừa sửa đổi với "đôi mắt tươi mới," nhìn thật cẩn thận để tìm bất kỳ lỗi rõ ràng, sai sót, vấn đề, rắc rối, nhầm lẫn, v.v."
Vâng, điều này mất một thời gian, nhưng đó là lý do tại sao thật tiện lợi khi có nhiều phiên CC mở cùng một lúc. Sau đó, bạn có thể chỉ cần xoay vòng qua chúng, dán câu đó vào lần nữa và lần nữa.
Bằng cách nào đó, những điều "đôi mắt tươi mới" thay đổi cách nó nhận thức những gì nó vừa viết theo một cách rất hữu ích.
Thật kỳ lạ, mẹo này dường như không hoạt động tốt với suy nghĩ của GPT-5-- nó có xu hướng chỉ nói "Đúng rồi, mọi thứ trông đúng!" Claude có xu hướng nghi ngờ nhiều hơn và dễ mắc lỗi bất cẩn ngay từ lần đầu tiên, nhưng lại giỏi trong việc phát hiện chúng nếu có đủ cơ hội.
4,83K
Ai đó tại OpenAI đã quyết định phá hỏng API cho GPT-5 (và o3, đây là một vấn đề cũ) để thay đổi tham số "max_tokens" thành "max_completion_tokens" nhằm cố gắng làm cho mọi thứ rõ ràng hơn… bạn đã mắc một sai lầm lớn. Nó sẽ không bao giờ bù đắp cho vô số giờ phút lãng phí của các lập trình viên trên mã bị hỏng.

1,43K
Sau vài ngày sử dụng cường độ cao GPT-5 qua Cursor và qua mô hình GPT-5 Pro trong ứng dụng web, tôi vẫn khẳng định mọi điều tôi đã nói về việc nó là một mô hình thông minh hơn nhiều và tốt hơn trong lập trình so với Opus 4.1.
Tôi vẫn thích Opus và thấy rằng sự tiện dụng của Claude Code ở nhiều khía cạnh là tốt hơn, nhưng nếu bạn đang cố gắng làm những việc thực sự khó khăn đòi hỏi tư duy nguyên tắc đầu tiên thông minh và kỹ năng khoa học máy tính, GPT-5 là một cấp độ mới.
Nhưng tôi nghi ngờ điều này chỉ xuất hiện khi chế độ nỗ lực lý luận được đặt ít nhất ở mức trung bình, và thực sự thể hiện rõ ràng với cài đặt nỗ lực cao.
Một ví dụ tốt là chuẩn bị tài liệu "redlines" của hai tài liệu pháp lý dài và phức tạp. Không phải là các phiên bản khác nhau của cùng một tài liệu, mà là hai tài liệu khác nhau đến từ một mẫu chung.
Đây là một vấn đề rất, rất khó để làm tốt, và yêu cầu nhiều mẹo và heuristics thông minh để đạt được hiệu suất và chất lượng đầu ra tốt (tôi đang nói về việc sử dụng các kỹ thuật lập trình truyền thống ở đây, không phải sử dụng LLMs để thực hiện so sánh này).
GPT-5 với tác nhân Cursor có thể đơn giản đưa ra nhiều ý tưởng tốt hơn, thông minh hơn (nhưng thực tế) nhanh hơn, và thực hiện chúng một cách chính xác mà không cần quá nhiều hướng dẫn, so với Opus 4.1.
Tuy nhiên, điều này phụ thuộc vào những gì bạn đang làm. Tôi vẫn nghĩ tôi thích mã frontend trong NextJS của Opus, chẳng hạn.
Nhưng bạn nên kiểm tra cho chính mình trên các vấn đề thực tế của bạn và không nên tin vào tất cả những người nói rằng mô hình này tệ và đó là bằng chứng cho việc chúng ta đã chạm vào một bức tường.
Hoặc là họ đang sử dụng phiên bản miễn phí tệ mà không suy nghĩ, hoặc họ không có khái niệm về cách tạo prompt hiệu quả, hoặc họ để cảm xúc của mình đối với OpenAI và Altman ảnh hưởng đến quan điểm của họ.
36,15K
Thật buồn cười khi bản demo GPT-5 lại nhấn mạnh nó là một nhà văn tuyệt vời... và sau đó lại trình diễn những câu văn lộn xộn với dấu gạch ngang trong mỗi câu thứ hai. Họ nên tập trung vào các bản demo lập trình, cái đó ấn tượng hơn nhiều!
Ngoài ra, tôi ghét việc họ đang loại bỏ tất cả các mô hình cũ...
1,36K
Tôi nghĩ rằng lời khen cao nhất mà tôi có thể dành cho @patrickc và đội ngũ Stripe là họ có một danh tiếng và thành tích tuyệt vời trong việc tạo ra giao diện người dùng/trải nghiệm người dùng (UI/UX) thực sự tinh tế và trực quan cho các dịch vụ của họ, đến mức rất tiện lợi khi tham khảo họ bằng tên trong các yêu cầu lập trình để có được kết quả tốt hơn từ các tác nhân lập trình AI.
Ví dụ, tôi có một biến thể của điều này được lưu trong trình soạn thảo văn bản của mình và dán nó vào Claude Code ít nhất 10 lần một ngày:
"Tôi muốn bạn làm một công việc tuyệt vời trong việc xây dựng các thành phần UI/UX đẳng cấp thế giới để hiển thị các báo cáo đánh giá này, cho thấy cả chi tiết và cũng như "huy hiệu" hoặc "thẻ tóm tắt," với sự tập trung mạnh mẽ vào việc tạo ra giao diện người dùng/trải nghiệm người dùng (UI/UX) hấp dẫn về mặt thị giác, thân thiện với người dùng, trực quan, bóng bẩy, tinh tế, đạt chất lượng "cấp Stripe" có thể cho điều này, tận dụng các thư viện tốt đã là một phần của dự án."
Sau đó, tôi nói với nó rằng bất cứ điều gì nó tạo ra thực sự không tốt lắm ("tồi tệ đến mức không thể tưởng tượng nổi" hoặc "không thể tin được là tệ") ngay cả khi nó đã khá tốt, và rằng nó phải CẢI THIỆN MỘT CÁCH ĐÁNG KỂ để thực sự đạt đến mức độ hài lòng và bóng bẩy, tinh tế, trực quan, v.v. của cấp Stripe.
Về cơ bản, áp dụng Kỹ thuật Gaslighting của Steve Jobs để đạt được kết quả "tuyệt vời đến điên rồ" một cách lặp đi lặp lại.
Và vâng, điều này hoạt động cực kỳ tốt nếu bạn cứ làm đi làm lại. Mẹo là bạn cần bao gồm TẤT CẢ những tính từ đó, nếu không nó sẽ trở thành những biểu tượng quay vòng và nhấp nháy như những nghệ sĩ nhào lộn ("bóng bẩy" và "hấp dẫn về mặt thị giác"); bạn cần các thuật ngữ khác như "tinh tế" và "trực quan" và "cấp Stripe" để làm dịu lại để nó cũng có phần tối giản và dễ sử dụng trong thực tế.
Tôi mừng vì tôi không phải làm việc cho chính mình như một tác nhân AI :/
1,72K
Chỉ cần đọc tài liệu GSPO mới từ nhóm Qwen.
Thật buồn cười khi thấy rằng những cải tiến lý thuyết lớn này, mặc dù có vẻ như có một nền tảng cơ bản sâu sắc (trong trường hợp này, việc tối ưu hóa qua các chuỗi token thì tốt hơn là tối ưu hóa qua các token riêng lẻ), cuối cùng lại chỉ đơn giản là cho phép các gradient chảy tốt hơn bằng cách tránh các vấn đề điều kiện số.
Khi bạn nhìn lại và xem xét, GSPO về cơ bản là một cách để có được điều kiện số tốt hơn bằng cách trung bình hóa mọi thứ lại với nhau nhiều hơn trong các bản cập nhật để tránh những cú sốc ồn ào (gần giống như việc sử dụng động lượng trong rmsprop hoặc Adam) và cũng bỏ qua các bản cập nhật có thể dẫn đến những tình huống "nguy hiểm" về mặt số học liên quan đến điều kiện.
Nhưng tất cả đều có lý từ góc độ lịch sử, vì học sâu thực sự bùng nổ khi chúng ta tìm ra cách để tránh vấn đề gradient biến mất/bùng nổ bằng cách sử dụng những thứ như động lượng trong các bộ tối ưu. Vì vậy, theo một cách nào đó, đây chỉ là bước mới nhất trong truyền thống đó để điều hướng cảnh quan mất mát một cách mạnh mẽ hơn nhằm tránh "lái vào rãnh."
3,34K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất