Месяц назад я отправил в Claude черновик рабочего документа — с именами, цифрами, внутренними деталями проекта. Уже после нажатия Enter поймал себя на мысли: а куда это всё уходит? Кто читает? Хранится ли это где-то?
Полез читать политики конфиденциальности. Провёл за этим несколько часов — и, честно говоря, обжёгся дважды: сначала на объёме юридического текста, потом на том, сколько всего там написано мелким шрифтом. Этот разбор — попытка пересказать главное человеческим языком.
Что ChatGPT делает с вашими диалогами по умолчанию
OpenAI по умолчанию использует ваши переписки для обучения моделей. Это не слухи — прямо написано в их политике. Если у вас обычный бесплатный аккаунт или Plus, ваши чаты попадают в обучающие данные, если вы сами не отключите эту опцию.
Отключить можно: Settings → Data Controls → Improve the model for everyone — ставите переключатель в положение "выкл". Я проверил — работает. Но включена эта штука по умолчанию, и большинство людей её не трогает, потому что попросту не знает о её существовании.
Дело в том, что OpenAI хранит историю чатов ещё 30 дней после того, как вы её удалили — для "безопасности и предотвращения злоупотреблений". То есть кнопка "удалить диалог" не означает немедленного удаления. Это законная практика, но говорить о ней в интерфейсе особо не принято.
Для корпоративных клиентов — ChatGPT Team и Enterprise — картина другая: там данные по умолчанию не идут в обучение и хранятся отдельно. Разница ощутимая, но и ценник соответствующий.
Как устроено у Anthropic и Claude
Claude по умолчанию ведёт себя осторожнее. Anthropic в своей политике указывает, что может использовать диалоги для улучшения моделей, но с оговорками.
Claude.ai хранит вашу историю, однако Anthropic заявляет, что не продаёт данные третьим сторонам и не использует их для таргетированной рекламы. Само по себе это не подвиг — у OpenAI тоже нет рекламной модели. Но формулировки у Anthropic аккуратнее, и это чувствуется.
На практике важнее другое: разработчики, которые подключаются напрямую через API, получают более строгие гарантии — их данные по умолчанию не используются для обучения. Это значит, что если вы пользуетесь каким-то приложением на базе Claude, там данные, скорее всего, защищены лучше, чем в обычном веб-чате.
Я специально искал у Anthropic аналог кнопки "отключить использование в обучении" для рядового пользователя Claude.ai — и не нашёл такой же явной опции, как у OpenAI. Возможно, плохо искал. Но уже сам факт, что это неочевидно, говорит кое-что о приоритетах интерфейса.
Что реально нельзя отправлять ни туда, ни туда
После всех этих чтений я составил для себя короткий список того, что не отправляю ни в Claude, ни в ChatGPT.
Медицинские данные о реальных людях. Не потому что компании плохие, а потому что ни одна политика конфиденциальности не даёт гарантий уровня HIPAA для бесплатных чат-сервисов.
Финансовые детали с реальными счётами и суммами. Если нужно проанализировать таблицу расходов — анонимизирую цифры перед отправкой.
Внутренние документы компании с именами клиентов или партнёров. Тут даже не про политику — просто деловая этика.
Пароли и ключи доступа. Казалось бы, очевидно. Но я видел людей, которые вставляли в чат куски конфигов с токенами. Не надо так.
На практике я подменяю реальные данные на заглушки: "компания А", "сумма X", "дата Y". Качество ответа от этого почти не страдает, зато я не переживаю.
Разница между веб-чатом и API
Вот деталь, которую большинство людей упускает. Когда вы пользуетесь ChatGPT или Claude через браузер — это одна история с точки зрения данных. Когда разработчик использует API — другая.
У OpenAI через API данные не идут в обучение по умолчанию, если разработчик не включил это явно. У Anthropic — аналогично. Получается, что сторонний корпоративный ассистент или специализированное приложение на базе этих моделей защищает ваши данные, скорее всего, лучше, чем официальный чат.
С другой стороны, тут появляется новая переменная: политика самого сервиса, который сидит поверх API. Разработчик приложения может хранить ваши запросы у себя — независимо от того, что делает OpenAI или Anthropic. Это уже отдельный разговор.
Что я вынес из этих чтений
Обе компании в целом ведут себя добросовестно — по меркам индустрии. Не продают данные рекламодателям, сотрудничают с регуляторами, политики у них внятные, пусть и длинные.
Только "добросовестно по меркам индустрии" — это не "полная конфиденциальность". Это значит: данные используются для развития продукта, хранятся какое-то время, могут просматриваться сотрудниками в рамках модерации.
Для большинства задач — написать текст, разобраться с кодом, обсудить идею — это вполне приемлемо. Для задач с реальными персональными данными, медициной, юриспруденцией конкретных людей — надо либо анонимизировать, либо смотреть в сторону локальных моделей.
Я после этого разбора стал аккуратнее. Не параноидально, но аккуратнее.
