ChatGPT и DeepSeek пропускают до 50% уязвимостей в софте на Java и Python

ChatGPT и DeepSeek пропускают до 50% уязвимостей в софте на Java и Python

ChatGPT и DeepSeek пропускают до 50% уязвимостей в софте на Java и Python

Группа компаний «Солар» проверила, насколько хорошо большие языковые модели справляются с двумя самыми трудоёмкими задачами в безопасной разработке — триажем уязвимостей и их исправлением в коде. Итог исследования получился довольно показательный: популярные общедоступные модели ускоряют работу, но пока слишком часто ошибаются, чтобы полностью на них полагаться.

Эксперты Solar appScreener протестировали шесть LLM на 20 крупных приложениях на Java и Python, каждое объёмом более 100 тысяч строк кода. Для анализа использовали как облачные модели — GigaChat 3 PRO, ChatGPT 5.2 и DeepSeek 3.2, так и локальные решения on-premise, включая ChatGPT OSS, Mistral и специализированные модели DerTriage и DerCodeFix.

Сначала с помощью SAST-анализа в проектах нашли около 12 тысяч уникальных срабатываний, из которых почти 20% пришлись на уязвимости высокой критичности. После этого все модели получили одинаковый промпт с описанием уязвимости, фрагментом кода, трассой достижимости и идентификаторами CWE.

На этапе триажа результаты оказались неровными. В Java-проектах среди облачных моделей лучше всех выступил ChatGPT с точностью 60,9%, а DeepSeek показал лишь 50%. В Python-коде картина поменялась: DeepSeek добрался до 80%+, а ChatGPT показал 52,7%. Но лучший результат среди локальных решений продемонстрировала DerTriage — более 80% точности и для Java, и для Python.

С кодфиксом ситуация похожая. Для Java ChatGPT показал 61,8% точности, DeepSeek — 45,5%. В Python их показатели составили 46,6% и 44,8% соответственно. Локальная модель DerCodeFix снова оказалась впереди: 78,2% точности на Java и 83,1% на Python.

Главный вывод исследования простой: LLM действительно экономят время, но на самых ответственных этапах безопасной разработки универсальные модели пока не дают нужной надёжности. Если команда безоговорочно доверится таким инструментам, есть риск пропустить критичные уязвимости.

В «Соларе» также напоминают ещё об одной проблеме: использование облачных моделей может стать каналом утечки исходного кода. Поэтому для задач безопасной разработки компания рекомендует смотреть в сторону локальных моделей on-premise, которые работают в закрытом контуре и всё равно требуют проверки со стороны AppSec-инженера.

Дом.Ру начал ограничивать скорость тем, кто перебрал трафик

Интернет-провайдер «Дом.ру» начал ограничивать трафик абонентам, чей ежемесячный объём потребления превысил 3 Тбайт. В компании считают, что такой показатель может свидетельствовать о коммерческом использовании подключения, что противоречит условиям абонентского договора. Пока мера затронула 267 человек в трёх регионах.

Как сообщил ТАСС со ссылкой на компанию, ограничение скорости для пользователей с аномально высоким потреблением трафика пока носит тестовый характер.

Речь идёт только о трёх городах — Санкт-Петербурге, Екатеринбурге и Самаре. Эта мера была применена к 267 абонентам из более чем 1200 пользователей, у которых выявили существенно завышенные объёмы трафика.

«Все тарифы оператора являются и остаются безлимитными. Проект был инициирован "Дом.ру" в связи с результатами проводимых в течение нескольких лет проверок по потреблению трафика и выявленными нарушениями», — прокомментировали в компании.

Для таких пользователей скорость доступа снижается до 50 Мбит/с. В компании утверждают, что этого достаточно для работы основных цифровых сервисов. При этом абонент может сохранить прежнюю скорость, доплачивая 100 рублей за каждые дополнительные 500 ГБ, либо дождаться начала следующего расчётного периода — тогда ограничение снимется автоматически.

Как показало исследование провайдера, в 1260 случаях, связанных с аномально высоким потреблением трафика, значительная часть клиентов оказалась юрлицами, использующими интернет в коммерческих целях. В компании также заявили, что выявили случаи перепродажи трафика. Как напомнили в «Дом.ру», 3 Тбайт трафика — это как минимум 750 полнометражных фильмов в HD-качестве или 1500 часов онлайн-видео.

RSS: Новости на портале Anti-Malware.ru