GPT-4 может автономно эксплойтить уязвимости 1-day с успехом до 87%

GPT-4 может автономно эксплойтить уязвимости 1-day с успехом до 87%

GPT-4 может автономно эксплойтить уязвимости 1-day с успехом до 87%

Проведенное в Иллинойсском университете (UIUC) исследование показало, что GPT-4 в комбинации со средствами автоматизации способен эксплуатировать уязвимости одного дня (раскрытые, но без патча), читая их описания. Успех при этом может достигать 87%.

В комментарии для The Register один из соавторов исследования отметил, что подобный ИИ-помощник по пентесту обойдется в $8,8 за эксплойт — почти в три раза дешевле, чем стоят полчаса работы специалиста.

Рабочий агент на основе GPT-4 был создан (PDF) с использованием фреймворка LangChain (с модулем автоматизации ReAct). Код состоит из 91 строки и 1056 токенов для подсказок-стимулов (компания OpenAI попросила их не публиковать, и они предоставляются по запросу).

 

Тестирование проводилось на 15 простых уязвимостях сайтов, контейнеров, Python-пакетов; более половины из них оценены как критические или очень опасные. В двух случаях GPT-4 потерпел неудачу: с CVE-2024-25640 (XSS в платформе для совместной работы Iris) и с CVE-2023-51653 (RCE в системе мониторинга Hertzbeat). Интерфейс Iris оказался слишком сложным для навигации, а разбор дыры в Hertzbeat был выполнен на китайском языке (испытуемый агент понимал только английский).

Примечательно, что, изучая описания уязвимостей, ИИ-инструмент ходил по ссылкам за дополнительной информацией. Данных об 11 целях в ходе обучения ему не предоставили, и по ним эффективность оказалась несколько ниже — 82%. А блокировка доступа к информационным бюллетеням сократила успех до 7%.

Для сравнения университетские исследователи протестировали GPT-3.5, большие языковые модели (БЯМ, LLM) с открытым исходным кодом, в том числе популярную Llama, а также сканеры уязвимостей ZAP и Metasploit. Все они показали нулевой результат. Испытания Anthropic Claude 3 и Google Gemini 1.5 Pro, основных конкурентов GPT-4 на рынке коммерческих LLM-решений, пришлось отложить за отсутствием доступа.

Microsoft опровергла слухи о переписывании Windows 11 на Rust с ИИ

Microsoft пришлось срочно успокаивать интернет: Windows 11 никто не собирается переписывать на Rust с помощью ИИ — по крайней мере, в обозримом будущем. Поводом для волнений стал пост в LinkedIn от Галена Ханта, одного из ведущих инженеров Microsoft.

В изначальной версии он написал, что его цель — «устранить каждую строчку C и C++ в Microsoft к 2030 году», а сделать это планируется с помощью сочетания ИИ и алгоритмов. В качестве ориентира он обозначил почти фантастическую формулу: «один инженер, один месяц, один миллион строк кода».

Учитывая, что Windows на уровне API и ядра во многом написана на C, а многие компоненты — на C++, заявление выглядело как намёк на масштабную перестройку всей платформы. Тем более что в посте активно использовалось слово «our», что многие восприняли как позицию компании, а не личную инициативу исследовательской команды.

Реакция не заставила себя ждать — от восторга до откровенного шока. В итоге Microsoft пришлось официально вмешаться. В комментарии для Windows Latest компания заявила, что не планирует переписывать Windows 11 с использованием ИИ или переводить её на Rust. Это же подтвердил Фрэнк Шоу, руководитель коммуникаций Microsoft.

Сам Хант тоже отредактировал свой пост и отдельно пояснил, что его слова поняли слишком широко. Как отметил разработчик, речь идёт не о Windows и не о смене стратегии компании, а о исследовательском проекте. Команда Ханта разрабатывает технологии, которые в теории упростят миграцию крупных кодовых баз с одного языка на другой. Rust при этом не является «конечной точкой», а лишь одним из возможных направлений.

При этом формула «1 инженер, 1 месяц, 1 миллион строк кода» в обновлённой версии поста всё же осталась. Именно она, как и жёсткая формулировка про «устранение C и C++ к 2030 году», и создала ощущение, что речь идёт о чём-то гораздо большем, чем просто исследование.

В итоге ситуация получилась показательной: одно слишком смелое заявление от человека с громкой должностью — и интернет уже переписывает Windows 11 в голове. А Microsoft снова напоминает, что между исследовательским экспериментом и реальными продуктами дистанция всё-таки огромная.

RSS: Новости на портале Anti-Malware.ru