Месяц назад коллега скинул в рабочий чат скриншот — он вставил в ChatGPT целый абзац из внутреннего договора, чтобы попросить ИИ переформулировать. Договор был с NDA. Я смотрел на этот скриншот и физически чувствовал, как где-то в отделе ИБ дёргается глаз.
После этого я засел разбираться: как вообще можно работать с ChatGPT в корпоративном контексте, не превращая каждый запрос в потенциальный инцидент. Вот что нашёл и что в итоге настроил.
Сначала про то, чего большинство не знает о данных в ChatGPT
Ситуация сильно зависит от того, чем именно пользуетесь. Бесплатный ChatGPT и платный Plus работают на условиях, при которых OpenAI по умолчанию может использовать переписку для дообучения моделей. Отключается в настройках, но по умолчанию — включено.
ChatGPT Team и Enterprise — другая история. OpenAI явно прописывает, что данные не идут на тренировку, история хранится с дополнительными ограничениями доступа, и вы получаете договор на обработку данных — DPA. Это минимум, который нужен бизнесу, чтобы разговор с юридическим отделом не превратился в допрос.
Я прошёл этот путь в обратном порядке: команда уже вовсю пользовалась бесплатными аккаунтами, и мне пришлось постфактум объяснять, почему это проблема. Лучше бы сразу.
Что конкретно нельзя туда вставлять — и почему это не очевидно
Когда я начал составлять список запрещённого, оказалось, что граница размытая. Персональные данные клиентов — понятно, нельзя. Исходный код проприетарных систем — тоже. Но дальше начинаются серые зоны.
Внутренние цены и условия контрактов — коммерческая тайна. Имена и должности сотрудников внутри конкретного проекта — персональные данные. Описание архитектуры системы, которую никто не анонсировал, — потенциально чувствительная техническая информация.
Я сделал для себя простой тест: "если это попадёт конкуренту или в публичный индекс — будет неприятно?" Если да — не вставляем в ChatGPT без предварительной обработки.
На практике это выглядит так: конкретику заменяем на заглушки. Вместо "ООО Ромашка, договор №4521 от 12 марта" пишем "компания А, договор Б". Вместо реальных имён — "сотрудник 1", "клиент X". Модель прекрасно справляется с задачей и на анонимизированном тексте — я проверял.
Как я настраивал корпоративный аккаунт
В Team и Enterprise в панели администратора есть несколько вещей, которые стоит сделать сразу.
Историю чатов лучше отключить или выставить срок хранения вручную. По умолчанию всё хранится бесконечно — это избыточно и создаёт риск. Кто-то уволится, забудет разлогиниться или просто потеряет ноутбук.
Дальше — SSO через корпоративный identity provider. Это не только про удобство, это про контроль: когда сотрудник уходит, его доступ отключается централизованно, а не висит до тех пор, пока он сам не вспомнит удалить аккаунт.
В Enterprise есть ещё одна вещь, которую я оценил: кастомные GPT с ограниченным набором инструкций и без доступа к интернету. Я настроил несколько таких рабочих пространств под конкретные задачи — один для работы с документацией, один для кода, один для коммуникаций. В системных промптах прописал, что можно делать, чего нельзя, в каком формате отвечать. Количество случайных "а дай-ка я вставлю сюда ещё и это" резко упало.
То, что я не предусмотрел и потом пожалел
Настроить инструмент — это половина дела. Вторая половина — объяснить людям, зачем это всё.
Я отправил команде документ с правилами. Прочитали примерно трое из десяти. Остальные продолжали работать как раньше: документ — это скучно, а ChatGPT — удобно прямо сейчас.
Пришлось зайти иначе. На общем созвоне разобрал один реальный пример — анонимизированный, конечно: вот что человек вставил, вот почему это проблема, вот как надо было. Без обвинений, просто разбор. После этого вопросов стало заметно меньше, а привычка анонимизировать перед отправкой начала появляться сама собой.
С другой стороны, был ещё один момент, который я не предусмотрел — плагины и интеграции. В Team можно подключать сторонние инструменты. Несколько человек сделали это самостоятельно, и я узнал случайно. Часть этих плагинов — маленькие компании с непрозрачной политикой хранения данных. Пришлось вводить правило: новые интеграции согласуются до подключения, не после.
Про API как альтернативу
Для части задач мы в итоге перешли на прямое использование API вместо веб-интерфейса. Данные не хранятся между запросами, если не настраивать историю специально, можно точнее управлять тем, что передаётся в запросе, и проще встроить проверки на стороне своего кода.
Да, это требует технических ресурсов. Зато можно написать простую обёртку, которая перед отправкой в API прогоняет текст через список стоп-паттернов — типичные форматы ИНН, номеров договоров, корпоративных email-адресов — и либо блокирует запрос, либо маскирует данные автоматически. Это надёжнее, чем надеяться, что все сотрудники всегда всё помнят.
Что в итоге
Полной гарантии не бывает — это я принял как факт. Любой инструмент можно использовать неосторожно, и ChatGPT не исключение. Но разница между "используем бесплатные аккаунты без правил" и "используем Enterprise с настроенным SSO, правилами анонимизации и разбором кейсов" — это разница между надеждой на удачу и реальным управлением рисками.
Коллега с тем NDA-договором, кстати, теперь сам объясняет новым людям в команде, как правильно готовить текст перед отправкой. Иногда лучший способ что-то донести — дать человеку разок столкнуться с последствиями, а потом показать, как делать нормально.
