Microsoft: системы на базе ИИ никогда не станут абсолютно безопасными

Татьяна Никитина 17 Января 2025 - 16:51

...

Microsoft: системы на базе ИИ никогда не станут абсолютно безопасными

Команда Microsoft AI Red Team (AIRT) подытожила свой опыт тестирования 100 продуктов, созданных в компании на основе генеративного ИИ, и пришла к выводу, что обеспечение безопасности таких систем — нескончаемый процесс.

Из-за фундаментальных ограничений ИИ-моделей угрозы вроде инъекции стимула и джейлбрейка в этой сфере неистребимы.

Однако такие атаки можно сделать более затратными — как и в случае с другими ИТ-рисками, которые удается снизить, применяя, к примеру, тактику эшелонированной защиты (defense-in-depth) или следуя принципам конструктивной безопасности (security-by-design).

Делясь опытом, в Red Team также отметили (PDF), что для выстраивания защиты ИИ-системы важно понимать ее возможности и учитывать сферу применения. Так, большие языковые модели (БЯМ, LLM) склонны слепо следовать инструкциям пользователя, и их легко обмануть, спрятав вредоносный контент в большом объеме безобидного текста при вводе.

Также атака на ИИ-помощника по литературному творчеству вряд ли приведет к серьезным последствиям, а в случае с LLM, предназначенной для анализа историй болезни, может нанести вред здоровью пациентов и поставить крест на репутации медучреждения.

Чтобы заставить LLM выдать вредный совет, необязательно проводить градиентные состязательные атаки. Тот же эффект можно получить более дешевым способом, манипулируя интерфейсом либо введя в заблуждение модель языка и технического зрения.

Еще одно важное наблюдение, которым поделились специалисты: использование ИИ увеличивает существующие риски и создает новые.

Напомним, вопросы использования ИИ недавно обсуждались в ходе Открытой конференции Института системного программирования РАН им. В. П. Иванникова. Участники пленарной дискуссии сошлись во мнении, что внедрение ИИ-технологий тормозят проблемы доверия и безопасности таких сервисов.

Следующая главная новость »

ИБ без ручного режима: как автоматизировать защиту в 2026?
Регистрируйтесь на эфир!

Екатерина Быстрова 27 Мая 2026 - 11:18

Фишинг Мошенничество Онлайн-мошенничество Домашние пользователи Лаборатория Касперского

Мошенники начали рассылать «работу мечты» через Google AppSheet

«Лаборатория Касперского» предупредила о новой фишинговой схеме: мошенники используют Google AppSheet, чтобы рассылать письма с заманчивыми предложениями о работе. Письмо приходит с настоящего сервисного адреса noreply@appsheet.com, отправитель выглядит как рекрутинговая команда крупной компании, а внутри — предложение обсудить карьерные возможности.

Схема в целом интересная: злоумышленники регистрируются в Google AppSheet, оформляют рассылку и маскируют её под сообщение от рекрутеров технологических компаний, FMCG-брендов или автопроизводителей.

Получателю предлагают перейти по ссылке, чтобы выбрать время встречи и оставить контактные данные.

Дальше начинается классика фишинга: пользователя уводят на мошенническую страницу, где просят ввести логин и пароль, например от Google-аккаунта. В итоге работа мечты превращается в мечту злоумышленников о чужих учётных данных.

Есть и другой сценарий: ссылки в письме может вообще не быть. Вместо этого адресата просят ответить команде рекрутеров. Скорее всего, дальше жертву начинают обрабатывать уже в переписке.

Почему такие письма проходят в почту? Потому что они идут через инфраструктуру Google. А значит, часто успешно проходят проверки SPF, DKIM и DMARC. Для пользователя это выглядит солидно, для фильтров — менее подозрительно.

Плюс AppSheet позволяет отправлять не только письма, но и СМС. Чтобы запустить такую кампанию, достаточно платной подписки даже на базовом тарифе. То есть порог входа низкий, а доверия к домену Google — много.

В «Лаборатории Касперского» отмечают, что злоумышленники всё чаще используют легитимные облачные сервисы в атаках. Раньше похожие схемы фиксировали с Google Формы, Google Задачи, Google Таблицы и даже OpenAI. Теперь в список добавился AppSheet.

ИБ без ручного режима: как автоматизировать защиту в 2026?
Регистрируйтесь на эфир!