Кому вы отдаёте свои данные: читаю политики конфиденциальнос

Месяц назад я отправил в Claude черновик рабочего документа — с именами, цифрами, внутренними деталями проекта. Уже после нажатия Enter поймал себя на мысли: а куда это всё уходит? Кто читает? Хранится ли это где-то?

Полез читать политики конфиденциальности. Провёл за этим несколько часов — и, честно говоря, обжёгся дважды: сначала на объёме юридического текста, потом на том, сколько всего там написано мелким шрифтом. Этот разбор — попытка пересказать главное человеческим языком.

Что ChatGPT делает с вашими диалогами по умолчанию

OpenAI по умолчанию использует ваши переписки для обучения моделей. Это не слухи — прямо написано в их политике. Если у вас обычный бесплатный аккаунт или Plus, ваши чаты попадают в обучающие данные, если вы сами не отключите эту опцию.

Отключить можно: Settings → Data Controls → Improve the model for everyone — ставите переключатель в положение "выкл". Я проверил — работает. Но включена эта штука по умолчанию, и большинство людей её не трогает, потому что попросту не знает о её существовании.

Дело в том, что OpenAI хранит историю чатов ещё 30 дней после того, как вы её удалили — для "безопасности и предотвращения злоупотреблений". То есть кнопка "удалить диалог" не означает немедленного удаления. Это законная практика, но говорить о ней в интерфейсе особо не принято.

Для корпоративных клиентов — ChatGPT Team и Enterprise — картина другая: там данные по умолчанию не идут в обучение и хранятся отдельно. Разница ощутимая, но и ценник соответствующий.

Как устроено у Anthropic и Claude

Claude по умолчанию ведёт себя осторожнее. Anthropic в своей политике указывает, что может использовать диалоги для улучшения моделей, но с оговорками.

Claude.ai хранит вашу историю, однако Anthropic заявляет, что не продаёт данные третьим сторонам и не использует их для таргетированной рекламы. Само по себе это не подвиг — у OpenAI тоже нет рекламной модели. Но формулировки у Anthropic аккуратнее, и это чувствуется.

На практике важнее другое: разработчики, которые подключаются напрямую через API, получают более строгие гарантии — их данные по умолчанию не используются для обучения. Это значит, что если вы пользуетесь каким-то приложением на базе Claude, там данные, скорее всего, защищены лучше, чем в обычном веб-чате.

Я специально искал у Anthropic аналог кнопки "отключить использование в обучении" для рядового пользователя Claude.ai — и не нашёл такой же явной опции, как у OpenAI. Возможно, плохо искал. Но уже сам факт, что это неочевидно, говорит кое-что о приоритетах интерфейса.

Что реально нельзя отправлять ни туда, ни туда

После всех этих чтений я составил для себя короткий список того, что не отправляю ни в Claude, ни в ChatGPT.

Медицинские данные о реальных людях. Не потому что компании плохие, а потому что ни одна политика конфиденциальности не даёт гарантий уровня HIPAA для бесплатных чат-сервисов.

Финансовые детали с реальными счётами и суммами. Если нужно проанализировать таблицу расходов — анонимизирую цифры перед отправкой.

Внутренние документы компании с именами клиентов или партнёров. Тут даже не про политику — просто деловая этика.

Пароли и ключи доступа. Казалось бы, очевидно. Но я видел людей, которые вставляли в чат куски конфигов с токенами. Не надо так.

На практике я подменяю реальные данные на заглушки: "компания А", "сумма X", "дата Y". Качество ответа от этого почти не страдает, зато я не переживаю.

Разница между веб-чатом и API

Вот деталь, которую большинство людей упускает. Когда вы пользуетесь ChatGPT или Claude через браузер — это одна история с точки зрения данных. Когда разработчик использует API — другая.

У OpenAI через API данные не идут в обучение по умолчанию, если разработчик не включил это явно. У Anthropic — аналогично. Получается, что сторонний корпоративный ассистент или специализированное приложение на базе этих моделей защищает ваши данные, скорее всего, лучше, чем официальный чат.

С другой стороны, тут появляется новая переменная: политика самого сервиса, который сидит поверх API. Разработчик приложения может хранить ваши запросы у себя — независимо от того, что делает OpenAI или Anthropic. Это уже отдельный разговор.

Что я вынес из этих чтений

Обе компании в целом ведут себя добросовестно — по меркам индустрии. Не продают данные рекламодателям, сотрудничают с регуляторами, политики у них внятные, пусть и длинные.

Только "добросовестно по меркам индустрии" — это не "полная конфиденциальность". Это значит: данные используются для развития продукта, хранятся какое-то время, могут просматриваться сотрудниками в рамках модерации.

Для большинства задач — написать текст, разобраться с кодом, обсудить идею — это вполне приемлемо. Для задач с реальными персональными данными, медициной, юриспруденцией конкретных людей — надо либо анонимизировать, либо смотреть в сторону локальных моделей.

Я после этого разбора стал аккуратнее. Не параноидально, но аккуратнее.