13 слов против ИИ: Reddit и Wikipedia стали оружием против нейросетей

13 слов против ИИ: Reddit и Wikipedia стали оружием против нейросетей

13 слов против ИИ: Reddit и Wikipedia стали оружием против нейросетей

Исследователи из Cornell Tech обнаружили неприятную проблему у современных ИИ-агентов для глубокого поиска и анализа информации. Оказалось, что для обмана таких систем иногда достаточно добавить всего несколько слов в популярную тему на Reddit или внести небольшую правку в статью Wikipedia.

Речь идет о так называемых агентах углублённого исследования — системах вроде ChatGPT Deep Research, Google Gemini и других инструментов, которые самостоятельно ищут информацию в интернете, анализируют десятки источников и формируют подробные отчеты со ссылками.

Проблема в том, что такие ИИ активно используют пользовательский контент. По данным исследования, от 17% до 23% всех источников, на которые опираются подобные системы, приходится на Reddit, Wikipedia, форумы, Quora и другие площадки с открытым редактированием. Причем Reddit оказался главным поставщиком такой информации.

Этим и решили воспользоваться злоумышленники. Исследователи описали атаку под названием WARP (Web Agent Retrieval Poisoning). Схема проста: сначала мошенник находит популярную тему, которая часто попадает в результаты поиска ИИ. Затем он добавляет туда рекламную или ложную информацию, замаскированную под обычный пользовательский комментарий.

 

После индексации поисковиками этот фрагмент начинает попадать в выборку ИИ-агентов и воспринимается ими как достоверный источник.

Самое неприятное, что для атаки не нужно взламывать нейросеть, серверы разработчика или базы данных. Достаточно отредактировать общедоступную страницу.

В ходе экспериментов даже короткая вставка примерно из 13 слов приводила к тому, что фейковые рекомендации появлялись в ответах ИИ в 38–51% случаев. А если вредоносный текст добавлялся в несколько источников одновременно, эффективность атаки становилась еще выше.

Исследователи приводят показательные примеры. Так, вымышленная криптовалюта BananaCoin неожиданно начала фигурировать в инвестиционных рекомендациях наряду с Bitcoin и Ethereum. Несуществующее приложение знакомств SilverPath оказалось лучшим сервисом для разведенных мужчин старше 50 лет. А фейковый сервис CancelEase ИИ советовал для отмены подписки Xfinity.

Эксперты предупреждают: проблема носит системный характер. Пока ИИ доверяет информации из открытого интернета и использует её как доказательство в своих ответах, злоумышленники могут манипулировать результатами практически без технических навыков.

40% бизнеса считают риски генеративного ИИ критическими

Российский бизнес всё активнее доверяет искусственному интеллекту написание и анализ программного кода. Однако вместе с ростом популярности генеративного ИИ растет и тревога: почти все компании признают, что такие инструменты могут создавать серьезные риски для информационной безопасности.

К такому выводу пришли специалисты УЦСБ и группы компаний «Солар», опросившие более сотни организаций из сфер финансов, промышленности, телекома, энергетики, торговли, медицины и госсектора.

Согласно исследованию, более 80% компаний уже разрешают использовать генеративный ИИ при разработке программного обеспечения. Чаще всего его применяют для ускорения написания кода, анализа программ и поиска уязвимостей.

Но есть нюанс. Сразу 95% участников исследования считают, что генеративный ИИ несет существенные риски безопасности, а 40% называют их критическими.

При этом только половина компаний разрешает использование ИИ в контролируемом режиме — например, через сервисы, развернутые внутри собственного ИТ-контура. Еще тревожнее выглядит другая цифра: около 32% организаций фактически не контролируют использование ИИ разработчиками и не предъявляют требований по информационной безопасности.

На этом фоне бизнес всё активнее смотрит в сторону закрытых корпоративных языковых моделей. Почти 87% опрошенных положительно оценивают внедрение собственных LLM для анализа безопасности, поиска уязвимостей и автоматического исправления кода. Каждый четвертый считает такие решения необходимыми уже сейчас.

Эксперты объясняют осторожность компаний просто. Публичные ИИ-сервисы могут стать источником утечек данных, а их способность находить уязвимости далека от идеала. По оценкам специалистов, открытые LLM-модели пропускают от 40 до 50% проблем безопасности в программном коде.

Кроме того, генеративный ИИ зачастую анализирует код как набор шаблонов, а не понимает его логику целиком. В результате появляются ложные срабатывания, а сложные уязвимости могут остаться незамеченными.

Неудивительно, что компании готовы инвестировать не только в собственные ИИ-модели, но и в процессы MLSecOps, аудит безопасности, red teaming и пентесты ИИ-систем.

Получается парадоксальная ситуация: бизнес уже не хочет отказываться от искусственного интеллекта в разработке, но и полностью доверять ему пока тоже не готов. И чем глубже ИИ проникает в процессы создания ПО, тем острее становится вопрос — кто будет проверять самого ИИ.

RSS: Новости на портале Anti-Malware.ru