Ошибка ChatGPT привела к утечке личных промптов в Google Search Console

Ошибка ChatGPT привела к утечке личных промптов в Google Search Console

Ошибка ChatGPT привела к утечке личных промптов в Google Search Console

Несколько месяцев подряд в Google Search Console — инструменте, который веб-мастера используют для анализа поискового трафика, — появляются очень странные запросы. Вместо привычных коротких ключевых слов там стали попадаться целые абзацы текста — личные обращения пользователей к ChatGPT.

Иногда длина таких «запросов» превышала 300 символов, а по содержанию они выглядели как частные разговоры: кто-то спрашивал совет по отношениям, кто-то обсуждал рабочие вопросы.

Проблему первым заметил аналитик Джейсон Пакер из компании Quantable. Он опубликовал запись в блоге, где рассказал о десятках подобных случаев, а позже объединился с SEO-экспертом Слободаном Маничем, чтобы разобраться, откуда берутся эти данные.

По их версии, найденной утечке нет аналогов: ChatGPT будто бы напрямую отправлял пользовательские запросы в Google Search, а затем те каким-то образом оказывались в отчётах GSC. Эксперты уверены, что речь идёт о «первом доказательстве того, что OpenAI действительно обращается к поиску Google с реальными пользовательскими промптами».

OpenAI комментировать гипотезу напрямую отказалась, но подтвердила, что «осведомлена о проблеме» и уже исправила ошибку, которая якобы «затронула небольшое количество поисковых запросов».

Пакер, впрочем, не убеждён, что всё так просто. Он считает, что компания не дала прямого ответа на главный вопрос — действительно ли OpenAI сканировала Google и передавала туда пользовательские промпты. Google ситуацию не прокомментировала.

Первые утёкшие фразы Пакер заметил ещё в сентябре. Среди них — поток сознания от девушки, пытавшейся понять, нравится ли она парню, и деловое сообщение офис-менеджера, обсуждающего возвращение сотрудников в офис. Всего Пакер насчитал около двухсот подобных записей только на одном сайте.

Дальнейшее расследование показало, что все эти запросы начинались с одинакового URL:
https://openai.com/index/chatgpt/

Google, как предполагают исследователи, разделил адрес на отдельные слова — openai, index, chatgpt — и начал воспринимать их как поисковый запрос. Из-за этого сайты, которые хорошо ранжировались по этим словам, начали видеть в своей консоли чужие фразы пользователей ChatGPT.

Пакер и Манич полагают, что причиной стала ошибка в одном из интерфейсов ChatGPT. При вводе запроса на странице с параметром hints=search модель почти всегда выполняла реальный поиск в интернете — и использовала при этом Google. Из-за сбоя ChatGPT добавлял к поисковому запросу часть адреса страницы и передавал всё это в Google как обычный поисковый запрос.

Поскольку запросы не шли через API, а именно через открытый поиск, они начали появляться в отчётах Search Console у тех сайтов, которые Google выбрал в результатах.

Пакер считает, что так утекали все промпты, где ChatGPT принимал решение искать сделать поиск в Google. OpenAI заявила, что инцидент затронул «небольшое количество запросов», но не уточнила, сколько именно пользователей могли пострадать.

Ранее уже была похожая история, когда пользовательские чаты ChatGPT попадали в индекс Google. Тогда OpenAI объяснила, что пользователи сами «неосознанно» сделали их публичными, поставив соответствующую галочку.

В этот раз, подчёркивает Пакер, всё гораздо хуже: никто ничего не публиковал добровольно. Пользователи просто писали запросы — и часть этих сообщений могла оказаться в инструментах аналитики чужих сайтов.

Эксперты называют ситуацию «менее опасной, но куда более странной». И хотя OpenAI утверждает, что проблема уже устранена, Пакер и Манич уверены: вопросов всё ещё больше, чем ответов.

Главный из них — перестала ли OpenAI вообще использовать Google Search для сбора данных, или просто изменила способ отправки запросов. Пока компания этого не уточнила.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Orion soft выпустила Nova AI — ИИ-оптимизированную Nova Container Platform

Компания Orion soft анонсировала новую редакцию своей платформы контейнеризации Nova Container Platform, получившую название Nova AI. Это первое российское Kubernetes-решение, адаптированное под задачи машинного обучения (МО) и искусственного интеллекта (ИИ).

По словам разработчиков, Nova AI создана для того, чтобы помочь ИТ-командам и специалистам по данным быстро развертывать инфраструктуру для обучения моделей, запуска LLM-сервисов и инференса, обеспечивая при этом безопасность и совместимость с отечественными операционными системами.

В Orion soft отмечают, что новая версия отвечает на типичные сложности, с которыми сталкиваются компании при внедрении МО- и ИИ-проектов:

  • высокая стоимость и дефицит GPU;
  • нехватка квалифицированных MLOps-инженеров;
  • длительное развертывание и настройка инфраструктуры;
  • требования по информационной безопасности и соответствию регуляторам;
  • низкая утилизация ресурсов.

Платформа позволяет оптимизировать использование GPU и снижать нагрузку на оборудование, а также ускоряет создание и выдачу инфраструктуры для команд разработчиков. Nova AI поддерживает развертывание как на физических серверах (bare metal), так и в виртуализированных средах, включая отечественные решения вроде zVirt, и полностью совместима с Astra Linux и РЕД ОС.

Для специалистов по данным платформа предоставляет готовое окружение с инструментами JupyterHub, MLflow, Airflow и MinIO, что позволяет быстрее переходить от экспериментов к эксплуатации.

В Nova AI реализованы встроенные механизмы безопасности: контейнерная защита на базе NeuVector, централизованное управление секретами с помощью StarVault, а также поддержка требований комплаенса и защиты токенов и данных.

По словам руководителя продукта Nova Container Platform Александра Фикса, к платформе сейчас проявляют наибольший интерес промышленные и нефтегазовые компании, банки, ретейлеры и госструктуры. Им важно быстро и безопасно развернуть инфраструктуру для ИИ, снизить расходы на оборудование и перейти от отдельных экспериментов к масштабируемым МО-платформам корпоративного уровня.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru