ChatGPT и DeepSeek пропускают до 50% уязвимостей в софте на Java и Python

Екатерина Быстрова 16 Марта 2026 - 19:15

Малый и средний бизнес

Корпорации

ГК «Солар»

Средства поиска уязвимостей

Уязвимости программ

GenAI (генеративный искусственный интеллект)

...

ChatGPT и DeepSeek пропускают до 50% уязвимостей в софте на Java и Python

Группа компаний «Солар» проверила, насколько хорошо большие языковые модели справляются с двумя самыми трудоёмкими задачами в безопасной разработке — триажем уязвимостей и их исправлением в коде. Итог исследования получился довольно показательный: популярные общедоступные модели ускоряют работу, но пока слишком часто ошибаются, чтобы полностью на них полагаться.

Эксперты Solar appScreener протестировали шесть LLM на 20 крупных приложениях на Java и Python, каждое объёмом более 100 тысяч строк кода. Для анализа использовали как облачные модели — GigaChat 3 PRO, ChatGPT 5.2 и DeepSeek 3.2, так и локальные решения on-premise, включая ChatGPT OSS, Mistral и специализированные модели DerTriage и DerCodeFix.

Сначала с помощью SAST-анализа в проектах нашли около 12 тысяч уникальных срабатываний, из которых почти 20% пришлись на уязвимости высокой критичности. После этого все модели получили одинаковый промпт с описанием уязвимости, фрагментом кода, трассой достижимости и идентификаторами CWE.

На этапе триажа результаты оказались неровными. В Java-проектах среди облачных моделей лучше всех выступил ChatGPT с точностью 60,9%, а DeepSeek показал лишь 50%. В Python-коде картина поменялась: DeepSeek добрался до 80%+, а ChatGPT показал 52,7%. Но лучший результат среди локальных решений продемонстрировала DerTriage — более 80% точности и для Java, и для Python.

С кодфиксом ситуация похожая. Для Java ChatGPT показал 61,8% точности, DeepSeek — 45,5%. В Python их показатели составили 46,6% и 44,8% соответственно. Локальная модель DerCodeFix снова оказалась впереди: 78,2% точности на Java и 83,1% на Python.

Главный вывод исследования простой: LLM действительно экономят время, но на самых ответственных этапах безопасной разработки универсальные модели пока не дают нужной надёжности. Если команда безоговорочно доверится таким инструментам, есть риск пропустить критичные уязвимости.

В «Соларе» также напоминают ещё об одной проблеме: использование облачных моделей может стать каналом утечки исходного кода. Поэтому для задач безопасной разработки компания рекомендует смотреть в сторону локальных моделей on-premise, которые работают в закрытом контуре и всё равно требуют проверки со стороны AppSec-инженера.

Следующая главная новость »

Самые свежие новости ИТ и ИБ. Обзоры, аналитика, анонсы главных ивентов
Подписывайтесь на телеграм-канал!

Екатерина Быстрова 29 Июля 2026 - 08:58

Соответствие законодательству РФ Домашние пользователи Государство

ФСБ объявила Павла Дурова в международный розыск

Основателя Telegram Павла Дурова объявляют в международный розыск. В России ему предъявили обвинение в содействии террористической деятельности по части 1.1 статьи 205.1 УК РФ, сообщила ФСБ.

По версии ведомства, администрация Telegram не удалила каналы, чаты и боты, которые украинские спецслужбы якобы использовали для подготовки диверсий и терактов в России, массовых убийств и кибермошенничества.

В ФСБ утверждают, что действия злоумышленников привели к человеческим жертвам, в том числе среди женщин и детей, а также причинили многомиллиардный материальный ущерб. Ответственность за неудаление соответствующих ресурсов ведомство возложило на руководство платформы.

«Руководителю администрации Telegram П. Дурову предъявлено обвинение в рамках расследуемого уголовного дела по признакам состава преступления, предусмотренного ч. 1.1 ст. 205.1 УК России, он объявляется в международный розыск», — говорится в сообщении ФСБ.

Другие подробности уголовного дела пока не раскрываются. Не уточняется, когда оно было возбуждено, вынесено ли судебное решение о заочном аресте Дурова и направлены ли российской стороной документы в Интерпол. Представители предпринимателя и Telegram на момент публикации заявление ФСБ не комментировали.

Telegram работает с 2013 года. Сейчас ежемесячная аудитория мессенджера превышает миллиард человек. Теперь к списку претензий разных государств к его модерации добавилось и российское уголовное дело, причём сразу с международным розыском основателя.

Самые свежие новости ИТ и ИБ. Обзоры, аналитика, анонсы главных ивентов
Подписывайтесь на телеграм-канал!