Новый вектор кражи данных: скрытые инструкции в изображениях для ИИ

Новый вектор кражи данных: скрытые инструкции в изображениях для ИИ

Новый вектор кражи данных: скрытые инструкции в изображениях для ИИ

Исследователи из компании Trail of Bits придумали новый способ атаки на ИИ-системы — через изображения с «невидимыми» инструкциями. Метод позволяет красть пользовательские данные, подсовывая скрытые промпты в картинки, которые потом обрабатываются моделью.

Фокус в том, что изображение изначально создаётся в полном разрешении и выглядит абсолютно нормально для человеческого глаза.

Но когда ИИ-система автоматически снижает качество картинки — например, чтобы сэкономить ресурсы, — в ней проявляются скрытые паттерны. Всё дело в том, что алгоритмы ресемплинга (nearest neighbor, bilinear или bicubic) создают артефакты, и на их фоне может «всплыть» спрятанный текст.

Так, в примере от Trail of Bits при использовании bicubic-декодирования тёмные зоны на картинке превращались в красные, а внутри появлялась чёткая чёрная надпись. ИИ воспринимал её как часть пользовательских инструкций и выполнял. Снаружи казалось, что всё работает как обычно, но фактически модель выполняла скрытые команды, что может привести к утечке данных.

 

На практике исследователи показали, что с помощью такого подхода удалось через Gemini CLI вытянуть данные из Google Calendar и переслать их на произвольный адрес — при этом инструмент Zapier MCP автоматически подтвердил операцию из-за настроек «trust=True».

Атака, по словам авторов, универсальна и требует лишь подстройки под конкретный алгоритм уменьшения изображения. Trail of Bits протестировала её на ряде систем:

  • Google Gemini CLI,
  • Vertex AI Studio,
  • веб-интерфейс Gemini,
  • Gemini API через llm CLI,
  • Google Assistant на Android,
  • Genspark.

Чтобы доказать работоспособность метода, исследователи даже выложили в открытый доступ свой инструмент Anamorpher (пока в бета-версии), который генерирует такие «аноморфные» изображения.

Что советуют в качестве защиты? Во-первых, ограничивать размеры картинок при загрузке. Во-вторых, если ресемплинг всё же нужен — показывать пользователю, какой именно вариант изображения попадёт в LLM. И, конечно, запрашивать подтверждение для любых чувствительных действий, если в картинке вдруг обнаружен текст. Но главное, подчеркивают в Trail of Bits, — это внедрение более надёжных архитектурных подходов, которые смогут противостоять не только мультимодальным, но и любым другим атакам через инъекции промптов.

WhatsApp возвращает анимации сообщений на iPhone

Разработчики WhatsApp (принадлежит корпорации Meta, признанной экстремистской и запрещённой в России) решили вернуть функцию, которую сами же когда-то убрали. В тестовой версии мессенджера для iOS снова появились анимации сообщений, но теперь пользователям дадут возможность самостоятельно отключить их одним переключателем.

Как сообщает WABetaInfo, нововведение обнаружили в бета-версии WhatsApp для iPhone 26.24.10.70, доступной через TestFlight.

Ранее разработчики полностью отказались от анимации появления сообщений на iOS: новые сообщения просто возникали в чате без каких-либо визуальных эффектов. Теперь компания решила дать этой функции второй шанс.

Причем речь идет не о возвращении старой анимации. WhatsApp подготовил новый эффект: сообщение не просто появляется в окне переписки, а плавно выплывает и слегка увеличивается в размере, пока занимает свое место в чате.

Вместе с этим разработчики добавили отдельную настройку для управления анимациями. В разделе «Настройки → Чаты → Анимации» появился новый переключатель «Сообщения». Он работает рядом с уже существующими настройками для эмодзи, стикеров и GIF-анимаций.

 

Таким образом, пользователи смогут сами решать, нужны ли им дополнительные визуальные эффекты или нет. Для тех, кого раздражают лишние движения интерфейса, это может оказаться даже важнее самой новой анимации.

Пока функция доступна лишь ограниченному числу участников программы тестирования. Как обычно бывает с экспериментальными возможностями WhatsApp, до массового релиза могут пройти недели или даже месяцы.

Впрочем, есть один любопытный момент. Аналогичная настройка недавно появилась и в бета-версии WhatsApp для Android. А когда Meta начинает одновременно тестировать функцию сразу на двух основных платформах, это обычно означает, что официальный запуск уже не за горами.

RSS: Новости на портале Anti-Malware.ru