Вчера мы запустили ChatGPT Atlas, наш новый веб-браузер. В Atlas агент ChatGPT может выполнять задачи за вас. Мы рады видеть, как эта функция делает работу и повседневную жизнь более эффективными и результативными для людей. Агент ChatGPT мощный и полезный, и разработан с учетом безопасности, но он все еще может допускать (иногда неожиданные!) ошибки, такие как попытка купить неправильный продукт или забыть проверить с вами перед тем, как предпринять важное действие. Одним из возникающих рисков, которые мы очень тщательно исследуем и смягчаем, являются инъекции команд, когда злоумышленники скрывают вредоносные инструкции на веб-сайтах, в электронных письмах или других источниках, чтобы попытаться обмануть агента и заставить его вести себя непредсказуемо. Цель злоумышленников может быть такой же простой, как попытка повлиять на мнение агента во время покупок, или такой же серьезной, как попытка заставить агента получить и раскрыть личные данные, такие как конфиденциальная информация из вашей электронной почты или учетные данные. Наша долгосрочная цель заключается в том, чтобы вы могли доверять агенту ChatGPT использовать ваш браузер так же, как вы бы доверяли своему самому компетентному, надежному и осведомленному о безопасности коллеге или другу. Мы усердно работаем над достижением этой цели. Для этого запуска мы провели обширное тестирование на уязвимости, внедрили новые методы обучения модели, чтобы вознаграждать модель за игнорирование вредоносных инструкций, реализовали перекрывающиеся защитные меры и добавили новые системы для обнаружения и блокировки таких атак. Однако инъекция команд остается неразрешенной проблемой безопасности, и наши противники будут тратить значительное время и ресурсы на поиск способов заставить агента ChatGPT поддаваться этим атакам. Чтобы защитить наших пользователей и помочь улучшить наши модели против этих атак: 1. Мы приоритизировали системы быстрого реагирования, чтобы помочь нам быстро идентифицировать блокирующие кампании атак, как только мы о них узнаем. 2. Мы также продолжаем активно инвестировать в безопасность, конфиденциальность и защиту - включая исследования для улучшения надежности наших моделей, мониторинга безопасности, контроля инфраструктционной безопасности и других методов, чтобы помочь предотвратить эти атаки с помощью многоуровневой защиты. 3. Мы разработали Atlas, чтобы предоставить вам инструменты для защиты. Мы добавили функцию, позволяющую агенту ChatGPT действовать от вашего имени, но без доступа к вашим учетным данным, называемую "режимом выхода из системы". Мы рекомендуем этот режим, когда вам не нужно предпринимать действия в ваших учетных записях. На сегодняшний день мы считаем, что "режим входа в систему" наиболее подходит для четко определенных действий на очень доверенных сайтах, где риски инъекции команд ниже. Попросить его добавить ингредиенты в корзину для покупок обычно безопаснее, чем широкая или неопределенная просьба, такая как "просмотреть мои электронные письма и предпринять необходимые действия". 4. Когда агент работает на чувствительных сайтах, мы также внедрили "Режим наблюдения", который предупреждает вас о чувствительном характере сайта и требует, чтобы вы имели активную вкладку, чтобы следить за работой агента. Агент приостановит свою работу, если вы уйдете с вкладки с конфиденциальной информацией. Это гарантирует, что вы остаетесь в курсе - и под контролем - того, какие действия выполняет агент. Со временем мы планируем добавить больше функций, защитных мер и средств безопасности, чтобы агент ChatGPT мог работать безопасно и надежно как в индивидуальных, так и в корпоративных рабочих процессах. Новые уровни интеллекта и возможностей требуют, чтобы технологии, общество и стратегии снижения рисков развивались вместе. И, как с компьютерными вирусами в начале 2000-х, мы считаем важным, чтобы все понимали ответственное использование, включая размышления о атаках инъекций команд, чтобы мы все могли научиться безопасно использовать эту технологию. Мы рады видеть, как агент ChatGPT будет усиливать ваши рабочие процессы в Atlas, и решительно настроены на нашу миссию по созданию самых безопасных, конфиденциальных и надежных технологий ИИ на благо всего человечества.