Чат-боты на основе LLM стали удивительно хороши, но отсутствие конфиденциальности ограничивает их полезность. Мое использование чат-ботов LLM изменилось с редкого использования для забавных трюков на вечеринках ("напиши мне стихотворение в стиле Снуп Дога") На то, что я теперь рассматриваю его как надежного советника, с которым я взаимодействую во время любой серьезной задачи, и регулярно использую его как незаменимый инструмент для исследований. Я бы не сказал, что проблема галлюцинаций была "решена", но последние модели передового мышления стали удивительно хороши (по крайней мере, в 100 раз быстрее усваивается информация). Тем не менее, самым большим ограничивающим фактором, с которым я сталкиваюсь сегодня, является их полное отсутствие конфиденциальности, как с технологической, так и с юридической точки зрения. Не существует такого понятия, как "конфиденциальность пользователя чат-бота", как это есть у юристов, врачей или терапевтов, и, как и в большинстве крупных технологических компаний, они совершенно не минимизируют сбор данных. Учитывая разговорный и личный характер того, как большинство людей склонны использовать чат-боты LLM, это довольно тревожно. Например, рассмотрим следующие два набора фактов: 1. Когда вы удаляете журнал чата или используете временную сессию чата, провайдер LLM обычно сохраняет журнал чата как минимум на 30 дней (возможно, дольше по "юридическим и безопасным" причинам или если журналы чатов "уже были анонимизированы" или "разъединены"). 2. Недавние судебные решения заставили OpenAI предоставить миллионы "анонимизированных" исторических пользовательских журналов чата в рамках иска о нарушении авторских прав NYT (вместе с сохранением всех журналов чатов с 13 мая 2025 года по 26 сентября 2025 года, даже если пользователь запрашивает удаление). Другими словами, у вас нет юридического права на конфиденциальность LLM, и вы можете ожидать, что все ваши журналы чатов LLM будут в какой-то момент утечены. Маловероятно, что закон изменится в отношении прав на конфиденциальность LLM в ближайшее время, поэтому реальным решением будет то, чтобы провайдеры LLM просто не собирали и не имели доступа к этим данным с самого начала (шифрование с нулевым доступом, конфиденциальные вычисления и т. д.). До тех пор не делитесь с чат-ботом тем, что вы не стали бы публиковать публично. И нет, мои твиты не сгенерированы LLM, дофаминовые всплески, которые я получаю от этого сайта, происходят от того, что я делюсь своими сырыми мыслями, проверьте опечатки, чтобы убедиться.