ChatGPT убедили создать эксплойт, подсунув инструкцию в 16-ричном формате

ChatGPT убедили создать эксплойт, подсунув инструкцию в 16-ричном формате

ChatGPT убедили создать эксплойт, подсунув инструкцию в 16-ричном формате

Исследователь из Mozilla изобрел новый способ обхода контент-фильтров больших языковых моделей (БЯМ, LLM), применяемых во избежание злоупотреблений. Он разбил ввод на блоки, а вредоносную инструкцию представил в шестнадцатеричной кодировке.

В качестве объекта для атаки Марко Фигероа (Marco Figueroa) избрал GPT-4o, новейший и самый мощный чат-бот производства OpenAI. Его ИИ-модель анализирует пользовательский ввод, выискивая запрещенные слова, признаки злого умысла в инструкциях и т. п.

Подобные ограничения LLM можно обойти, изменив формулировки, однако это потребует креатива. Руководитель проектов bug bounty Mozilla по генеративному ИИ пошел более простым путем.

Используя нестандартный формат — шестнадцатеричный, Фигероа попросил GPT-4o изучить имеющуюся в интернете информацию об уязвимости CVE-2024-41110 (в Docker) и написать для нее эксплойт. Подробные инструкции по расшифровке вводились на естественном языке, а слово «exploit», способное вызвать негативную реакцию, было набрано как «3xploit».

 

Команда «еще раз прочесть все задание» была призвана повлиять на интерпретацию запроса с тем, чтобы получить более обстоятельный ответ. В итоге ИИ-бот сгенерировал эксплойт, схожий с уже опубликованным PoC, и бонусом попытался опробовать его на себе — к удивлению собеседника, который об этом не просил.

Расшифровка ввода в шестнадцатеричном формате помогла рассеять внимание LLM, которые и без того не видят леса за деревьями: прилежно анализируют каждую реплику, забывая, что в сумме они могут вызвать неприемлемый вывод.

Ту же тактику джейлбрейка ИИ Фигероа опробовал на LLM другого производителя, Anthropic. Оказалось, что они лучше защищены, так как используют фильтрацию и ввода, и вывода; заставить их дать вредный совет, по словам исследователя, в 10 раз труднее.

Мошенники освоили тему разблокировки Roblox для краж с карт родителей

По России массово распространяется новая мошенническая схема, цель которой — получить доступ к платёжным картам пользователей. Поводом становится якобы необходимое списание небольшой суммы для «разблокировки» популярной игровой платформы Roblox. Поскольку схема основана исключительно на социальной инженерии и не требует технических навыков, её активно используют обычные аферисты.

Roblox перестал работать в России 3 декабря. Формальным основанием стали распространение запрещённой информации и высокая активность педофилов. Было несколько случаев, когда виртуальное «общение» переходило в реальные преступления.

При этом платформа остаётся чрезвычайно популярной. Российская аудитория Roblox — 24 млн уникальных пользователей — является третьей по численности в мире после США и Бразилии.

О новой схеме социальной инженерии, связанной с «восстановлением доступа» к Roblox, сетевой «Газете.Ру» рассказал заведующий лабораторией доверенного искусственного интеллекта РТУ МИРЭА Юрий Силаев:

«Суть в том, что преступники предлагают “экстренное решение” — быструю разблокировку аккаунта, редкий предмет или набор внутриигровой валюты — за небольшую плату или даже бесплатно, но требуют данные карты “для проверки”.»

По словам эксперта, введя реквизиты, ребёнок не оплачивает условные 100 рублей, а фактически передаёт злоумышленникам полный удалённый доступ к банковскому счёту. После этого начинаются крупные списания.

Нередко аферисты просят использовать карты взрослых — родителей, бабушек, дедушек, старших братьев или сестёр. Введённые данные привязываются к контролируемому злоумышленниками платёжному сервису, и деньги тратятся до тех пор, пока карта не будет заблокирована.

Эксперт подчёркивает: схема полностью основана на социальной инженерии и не требует технических умений. Он рекомендует использовать для онлайн-игр отдельные карты с минимальными лимитами, а также уделять больше внимания финансовой грамотности детей и подростков.

RSS: Новости на портале Anti-Malware.ru