GPT-5 ошибся в задаче по стохастическому анализу, показав пределы ИИ

GPT-5 ошибся в задаче по стохастическому анализу, показав пределы ИИ

GPT-5 ошибся в задаче по стохастическому анализу, показав пределы ИИ

Математики из Университета Люксембурга проверили, на что способен GPT-5 в серьёзных задачах по стохастическому анализу. Они поручили модели расширить так называемую теорему о четвёртом моменте, добавив к ней явные скорости сходимости — ранее это никто не делал в рамках подхода Мальявена–Стейна.

Поводом для эксперимента стали заявления, что GPT-5 уже умеет решать нетривиальные задачи в оптимизации.

Но на практике вышло иначе: ИИ допускал критические ошибки, требовал постоянных подсказок и корректировок. В частности, он даже пропустил ключевое свойство ковариации, которое легко вывести из предоставленных материалов.

Учёные сравнили работу с GPT-5 с взаимодействием с неопытным помощником, за которым нужно всё тщательно перепроверять.

И предупредили: если аспиранты начнут слишком полагаться на такие инструменты, они рискуют лишиться важного опыта — проб и ошибок, без которых не формируется настоящее математическое мышление.

Напомним, в прошлом месяце исследователи нашли необычную уязвимость в GPT-5, которая получила название PROMISQROUTE. Суть проблемы в том, что ответы пользователю не всегда формируются самой GPT-5: внутри работает специальный «роутер», который решает, какой именно из моделей поручить обработку запроса.

Кроме того, в августе мы сообщали о новом джейлбрейке, который обходит защиту GPT-5 с помощью скрытых историй.

В ИИ-приложениях почти каждая третья уязвимость оказалась высокорисковой

ИИ-приложения снова напоминают: если к обычному веб-сервису прикрутить большую языковую модель, магия появляется не только в презентации, но и в списке уязвимостей. По данным «Информзащиты», в 2026 году 32% уязвимостей, найденных при пентестах ИИ- и LLM-приложений, относятся к высокорисковым.

Для сравнения: по всем классам активов этот показатель составляет около 12%. То есть риск-профиль ИИ-приложений оказался в 2,7 раза выше среднего.

За второй год наблюдений пропорция не изменилась. Более того, медианный срок устранения серьёзных находок вырос с 19 дней в 2025 году до 36 дней в 2026-м.

Проблема в том, что ИИ-системы тащат за собой сразу два слоя риска. Первый — классика веба и API: аутентификация, авторизация, инъекции, секреты, обработка пользовательского ввода.

Второй — уже нейросетевой зоопарк: инъекции в промпт, утечки системного промпта, ошибки RAG-контуров, отравление данных, небезопасная обработка ответов LLM, проблемы в векторных хранилищах и отказ в обслуживании на уровне модели.

Особенно весело становится, когда модель подключают к корпоративным данным, CRM, базе знаний, API или инструментам автоматизации. В этот момент чат-бот перестаёт быть просто болталкой и получает возможность влиять на процессы. А ошибка в правах или логике вызовов превращает его в аккуратную дверь во внутренние системы.

Автоматическими сканерами всё это ловится плохо. По данным исследования, 78% команд сталкивались с тем, что такие средства пропускали критические уязвимости. Поэтому готовность полностью доверить пентесты автономным инструментам за год упала с 29% до 9%.

С устранением тоже не праздник. В 2026 году компании закрывали только 38,4% высокорисковых находок в ИИ / LLM-приложениях — это самый низкий показатель среди типов тестирования. Для API, например, он составил 77,3%.

RSS: Новости на портале Anti-Malware.ru