ChatGPT и DeepSeek пропускают до 50% уязвимостей в софте на Java и Python

ChatGPT и DeepSeek пропускают до 50% уязвимостей в софте на Java и Python

ChatGPT и DeepSeek пропускают до 50% уязвимостей в софте на Java и Python

Группа компаний «Солар» проверила, насколько хорошо большие языковые модели справляются с двумя самыми трудоёмкими задачами в безопасной разработке — триажем уязвимостей и их исправлением в коде. Итог исследования получился довольно показательный: популярные общедоступные модели ускоряют работу, но пока слишком часто ошибаются, чтобы полностью на них полагаться.

Эксперты Solar appScreener протестировали шесть LLM на 20 крупных приложениях на Java и Python, каждое объёмом более 100 тысяч строк кода. Для анализа использовали как облачные модели — GigaChat 3 PRO, ChatGPT 5.2 и DeepSeek 3.2, так и локальные решения on-premise, включая ChatGPT OSS, Mistral и специализированные модели DerTriage и DerCodeFix.

Сначала с помощью SAST-анализа в проектах нашли около 12 тысяч уникальных срабатываний, из которых почти 20% пришлись на уязвимости высокой критичности. После этого все модели получили одинаковый промпт с описанием уязвимости, фрагментом кода, трассой достижимости и идентификаторами CWE.

На этапе триажа результаты оказались неровными. В Java-проектах среди облачных моделей лучше всех выступил ChatGPT с точностью 60,9%, а DeepSeek показал лишь 50%. В Python-коде картина поменялась: DeepSeek добрался до 80%+, а ChatGPT показал 52,7%. Но лучший результат среди локальных решений продемонстрировала DerTriage — более 80% точности и для Java, и для Python.

С кодфиксом ситуация похожая. Для Java ChatGPT показал 61,8% точности, DeepSeek — 45,5%. В Python их показатели составили 46,6% и 44,8% соответственно. Локальная модель DerCodeFix снова оказалась впереди: 78,2% точности на Java и 83,1% на Python.

Главный вывод исследования простой: LLM действительно экономят время, но на самых ответственных этапах безопасной разработки универсальные модели пока не дают нужной надёжности. Если команда безоговорочно доверится таким инструментам, есть риск пропустить критичные уязвимости.

В «Соларе» также напоминают ещё об одной проблеме: использование облачных моделей может стать каналом утечки исходного кода. Поэтому для задач безопасной разработки компания рекомендует смотреть в сторону локальных моделей on-premise, которые работают в закрытом контуре и всё равно требуют проверки со стороны AppSec-инженера.

Отраслевые ассоциации просят сохранить доступ к зарубежным мессенджерам

Ассоциация разработчиков программных продуктов (АРПП) «Отечественный софт» обратилась в правительство с просьбой сохранить возможность рабочей коммуникации через мессенджеры WhatsApp и Telegram. Соответствующее письмо исполнительный директор АРПП Ренат Лашин направил ещё в феврале.

Как отметил сам Ренат Лашин в комментарии для «Ведомостей», ограничения в работе наиболее популярных зарубежных мессенджеров создают серьёзные препятствия для компаний-экспортёров.

В ассоциации предложили определить круг организаций, для которых такие каналы связи критически важны для взаимодействия с зарубежными партнёрами.

Глава Ассоциации «РУССОФТ», состав которой во многом пересекается с АРПП, Валентин Макаров в своём официальном телеграм-канале привёл результаты опроса, согласно которым ограничения в работе Telegram создают неудобства для 90% участников ассоциации.

В комментарии для «Ведомостей» Минцифры предложило использовать мессенджер MAX. Однако, как отметил Валентин Макаров, у этого решения есть два существенных недостатка: отсутствие ряда необходимых функций и недостаточная санкционная устойчивость. В результате, по его словам, зарубежные партнёры могут склонять российских экспортёров к использованию других иностранных продуктов, которые также способны создавать серьёзные риски.

«В данной ситуации выходом может быть заключение соглашения между дружественными странами о применении децентрализованного решения, аналогичного электронной почте, где независимые почтовые серверы обмениваются сообщениями по стандартным протоколам, а клиентская часть имеет открытый исходный код. Клиенты в этих странах получают равные возможности для коммуникации, а сами страны несут полную ответственность за соблюдение общих стандартов безопасности и контроля», — предложил Валентин Макаров.

«Формально компании могут использовать средства обхода блокировок, — отметил в комментарии для «Ведомостей» председатель совета по противодействию технологическим правонарушениям КС НСБ России Игорь Бедеров. — Но складывается ситуация, при которой корпоративные требования безопасности запрещают это, а правила бизнеса не позволяют общаться с клиентами и заказчиками с личных устройств».

RSS: Новости на портале Anti-Malware.ru