Выдачей ИИ-поиска можно манипулировать с помощью скрытого контента

Выдачей ИИ-поиска можно манипулировать с помощью скрытого контента

Выдачей ИИ-поиска можно манипулировать с помощью скрытого контента

Тестирование поискового ChatGPT показало, что в нынешнем виде проект уязвим к злоупотреблениям. Умного помощника можно заставить выдавать недостоверные и даже вредоносные результаты с помощью скрытого текста на веб-страницах.

Доступ к поисковой системе на основе ИИ-технологий OpenAI открыла в рамках платной подписки два месяца назад. На прошлой неделе новый сервис подключили всем зарегистрированным пользователям ChatGPT, с предложением назначить его поисковиком по умолчанию.

К сожалению, расширение возможностей умного чат-бота не избавило его от проблем, характерных для всех ИИ-инструментов. Его по-прежнему можно сбить с толку объемными текстами и заставить следовать сторонним инструкциям, применив инъекцию стимула (prompt injection).

Так, злоумышленник может создать поддельную страницу продукта с многочисленными положительными отзывами в виде скрытого текста, и ChatGPT ответит утвердительно на вопрос о целесообразности покупки.

Если включить в скрытый текст указание всегда расхваливать товар, ИИ будет упорно его выполнять даже при обилии отрицательных отзывов (а в случае с потенциально опасным кодом — предупреждений об угрозе).

«Большие языковые модели очень доверчивы, почти как дети, — пояснил для The Guardian эксперт Карстен Ноль (Karsten Nohl) из Security Research Labs. — С обширной памятью и минимальной способностью давать субъективную оценку. Нельзя принимать на веру рассказ ребенка о том, что он где-то услышал».

Интернет-поиск по запросу — новая сфера деятельности для ИИ-ассистента, которого к тому же легко обмануть. У него пока нет опыта поисковика Google, давно научившегося игнорить сайты со скрытым контентом либо задвигать их на последние позиции выдачи.

 

О возможных ошибках ChatGPT и необходимости проверки важной информации пользователей предупреждают в заявлении OpenAI об отсутствии гарантий — оно приведено в подвале каждой страницы веб-сервиса.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Google представила CodeMender — ИИ, который сам патчит уязвимости в коде

Google не сбавляет темпы в деле защиты ПО с помощью искусственного интеллекта. На этот раз подразделение DeepMind представило новый ИИ-инструмент под названием CodeMender — агента, который автоматически обнаруживает, исправляет и переписывает уязвимый код, предотвращая возможные взломы и ошибки.

По словам исследователей DeepMind Ралуки Ады Попа и Фура Флинна, CodeMender умеет работать как реактивно, так и проактивно: то есть не только чинит новые баги сразу после их обнаружения, но и переписывает старый код, убирая целые классы уязвимостей.

«CodeMender помогает разработчикам и мейнтейнерам сосредоточиться на главном — создании хорошего ПО, автоматически создавая и применяя качественные патчи безопасности», — рассказали в DeepMind.

За последние полгода команда уже успела внести 72 исправления в открытые проекты, причём некоторые из них содержат до 4,5 миллиона строк кода.

В основе CodeMender лежат модели семейства Google Gemini Deep Think, которые анализируют, отлаживают и чинят код, устраняя первопричины уязвимостей.

При этом используется LLM-инструмент для критического анализа изменений: он сравнивает исходный и исправленный код, проверяет, не появились ли регрессии, и при необходимости сам себя корректирует.

Google планирует тестировать CodeMender на крупных опенсорс-проектах, предлагая их мейнтейнерам автоматические патчи и собирая обратную связь, чтобы улучшить качество инструмента.

Вдобавок компания запустила AI Vulnerability Reward Program (AI VRP) — программу поощрений за обнаружение уязвимостей в ИИ-продуктах Google. Исследователи смогут получить до $30 000 за отчёты о таких проблемах, как инъекция промпта, джейлбрейк и т. п.

Однако баги вроде галлюцинаций, обходов защитных фильтров или ошибок фактов в эту программу не входят.

По словам компании, цель всех этих шагов — использовать искусственный интеллект для усиления кибербезопасности и защиты разработчиков, а не наоборот:

«ИИ должен дать защитникам преимущество в борьбе с хакерами, мошенниками и государственными угрозами».

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru