Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Hôm qua, chúng tôi đã ra mắt ChatGPT Atlas, trình duyệt web mới của chúng tôi. Trong Atlas, đại lý ChatGPT có thể hoàn thành công việc cho bạn. Chúng tôi rất hào hứng để xem tính năng này giúp công việc và cuộc sống hàng ngày trở nên hiệu quả và hiệu quả hơn cho mọi người như thế nào.
Đại lý ChatGPT mạnh mẽ và hữu ích, được thiết kế để an toàn, nhưng nó vẫn có thể mắc phải những sai lầm (đôi khi bất ngờ!), như cố gắng mua sản phẩm sai hoặc quên kiểm tra với bạn trước khi thực hiện một hành động quan trọng.
Một rủi ro mới nổi mà chúng tôi đang nghiên cứu và giảm thiểu một cách rất cẩn thận là tiêm lệnh, nơi kẻ tấn công ẩn giấu các hướng dẫn độc hại trong các trang web, email hoặc các nguồn khác, để cố gắng lừa đại lý hành động theo những cách không mong muốn. Mục tiêu của kẻ tấn công có thể đơn giản như cố gắng thiên lệch ý kiến của đại lý trong khi mua sắm, hoặc nghiêm trọng hơn là một kẻ tấn công cố gắng khiến đại lý lấy và rò rỉ dữ liệu riêng tư, chẳng hạn như thông tin nhạy cảm từ email của bạn, hoặc thông tin xác thực.
Mục tiêu lâu dài của chúng tôi là bạn nên có thể tin tưởng đại lý ChatGPT sử dụng trình duyệt của bạn, giống như bạn tin tưởng đồng nghiệp hoặc bạn bè có năng lực, đáng tin cậy và nhận thức về an ninh nhất. Chúng tôi đang làm việc chăm chỉ để đạt được điều đó. Đối với lần ra mắt này, chúng tôi đã thực hiện kiểm tra đỏ rộng rãi, triển khai các kỹ thuật đào tạo mô hình mới để thưởng cho mô hình vì đã bỏ qua các hướng dẫn độc hại, triển khai các biện pháp bảo vệ và an toàn chồng chéo, và thêm các hệ thống mới để phát hiện và chặn các cuộc tấn công như vậy. Tuy nhiên, tiêm lệnh vẫn là một vấn đề an ninh chưa được giải quyết, và các đối thủ của chúng tôi sẽ dành thời gian và tài nguyên đáng kể để tìm cách khiến đại lý ChatGPT mắc phải những cuộc tấn công này.
Để bảo vệ người dùng của chúng tôi, và để giúp cải thiện các mô hình của chúng tôi chống lại những cuộc tấn công này:
1. Chúng tôi đã ưu tiên các hệ thống phản ứng nhanh để giúp chúng tôi nhanh chóng xác định các chiến dịch tấn công chặn khi chúng tôi nhận thức được chúng.
2. Chúng tôi cũng đang tiếp tục đầu tư mạnh mẽ vào an ninh, quyền riêng tư và an toàn - bao gồm nghiên cứu để cải thiện độ bền của các mô hình của chúng tôi, các giám sát an ninh, các biện pháp kiểm soát an ninh hạ tầng, và các kỹ thuật khác để giúp ngăn chặn những cuộc tấn công này thông qua phòng thủ sâu.
3. Chúng tôi đã thiết kế Atlas để cung cấp cho bạn các điều khiển giúp bảo vệ bản thân. Chúng tôi đã thêm một tính năng cho phép đại lý ChatGPT thực hiện hành động thay mặt bạn, nhưng không có quyền truy cập vào thông tin xác thực của bạn gọi là "chế độ đăng xuất". Chúng tôi khuyên bạn nên sử dụng chế độ này khi bạn không cần thực hiện hành động trong tài khoản của mình. Ngày nay, chúng tôi nghĩ rằng "chế độ đăng nhập" là phù hợp nhất cho các hành động có phạm vi rõ ràng trên các trang web rất đáng tin cậy, nơi mà rủi ro của tiêm lệnh thấp hơn. Yêu cầu nó thêm nguyên liệu vào giỏ hàng thường an toàn hơn so với một yêu cầu rộng hoặc mơ hồ như "xem xét email của tôi và thực hiện bất kỳ hành động nào cần thiết."
4. Khi đại lý hoạt động trên các trang nhạy cảm, chúng tôi cũng đã triển khai một "Chế độ Giám sát" để cảnh báo bạn về tính nhạy cảm của trang và yêu cầu bạn phải giữ tab hoạt động để theo dõi đại lý thực hiện công việc của nó. Đại lý sẽ tạm dừng nếu bạn rời khỏi tab có thông tin nhạy cảm. Điều này đảm bảo bạn luôn nhận thức - và kiểm soát - những hành động mà đại lý đang thực hiện.
Theo thời gian, chúng tôi dự định thêm nhiều tính năng, biện pháp bảo vệ và kiểm soát an toàn hơn để cho phép đại lý ChatGPT hoạt động an toàn và bảo mật trong cả quy trình làm việc cá nhân và doanh nghiệp.
Các cấp độ trí tuệ và khả năng mới yêu cầu công nghệ, xã hội, và chiến lược giảm thiểu rủi ro phải cùng phát triển. Và giống như các virus máy tính vào đầu những năm 2000, chúng tôi nghĩ rằng điều quan trọng là mọi người phải hiểu cách sử dụng có trách nhiệm, bao gồm cả việc suy nghĩ về các cuộc tấn công tiêm lệnh, để chúng ta có thể học hỏi để hưởng lợi từ công nghệ này một cách an toàn.
Chúng tôi rất hào hứng để xem đại lý ChatGPT sẽ nâng cao quy trình làm việc của bạn trong Atlas như thế nào, và chúng tôi kiên quyết trong sứ mệnh xây dựng các công nghệ AI an toàn, riêng tư và bảo mật nhất vì lợi ích của toàn nhân loại.
Hàng đầu
Thứ hạng
Yêu thích
