GPT-5 ошибся в задаче по стохастическому анализу, показав пределы ИИ

GPT-5 ошибся в задаче по стохастическому анализу, показав пределы ИИ

GPT-5 ошибся в задаче по стохастическому анализу, показав пределы ИИ

Математики из Университета Люксембурга проверили, на что способен GPT-5 в серьёзных задачах по стохастическому анализу. Они поручили модели расширить так называемую теорему о четвёртом моменте, добавив к ней явные скорости сходимости — ранее это никто не делал в рамках подхода Мальявена–Стейна.

Поводом для эксперимента стали заявления, что GPT-5 уже умеет решать нетривиальные задачи в оптимизации.

Но на практике вышло иначе: ИИ допускал критические ошибки, требовал постоянных подсказок и корректировок. В частности, он даже пропустил ключевое свойство ковариации, которое легко вывести из предоставленных материалов.

Учёные сравнили работу с GPT-5 с взаимодействием с неопытным помощником, за которым нужно всё тщательно перепроверять.

И предупредили: если аспиранты начнут слишком полагаться на такие инструменты, они рискуют лишиться важного опыта — проб и ошибок, без которых не формируется настоящее математическое мышление.

Напомним, в прошлом месяце исследователи нашли необычную уязвимость в GPT-5, которая получила название PROMISQROUTE. Суть проблемы в том, что ответы пользователю не всегда формируются самой GPT-5: внутри работает специальный «роутер», который решает, какой именно из моделей поручить обработку запроса.

Кроме того, в августе мы сообщали о новом джейлбрейке, который обходит защиту GPT-5 с помощью скрытых историй.

F6 запустила сервис активного сканирования для проверки на уязвимости 

Компания F6 сообщила о запуске сервиса активного сканирования в составе решения F6 Attack Surface Management (ASM). Новый модуль под названием F6 ASM TRY предназначен для проверки внешнего периметра организаций с имитацией поведения реальных атакующих.

В отличие от пассивного анализа, который опирается на OSINT, исторические данные и открытые источники, активное сканирование предполагает прямое взаимодействие с инфраструктурой компании.

Сервис инициирует запросы к цифровым активам, выявляет открытые порты, доступные сервисы, уязвимости и потенциальные точки входа. При необходимости возможен углублённый анализ, чтобы уточнить контекст и понять, есть ли признаки вредоносной активности.

По данным F6, в начале 2026 года в инфраструктурах российских компаний в среднем выявляется 425 критических проблем. Чаще всего речь идёт о небезопасных конфигурациях серверов и устаревшем программном обеспечении.

Среднее количество цифровых активов на одну организацию — 4614. Такой масштаб сам по себе создаёт риски: любой забытый сервис или неконтролируемый хост может стать отправной точкой атаки, особенно если инфраструктура растёт быстрее, чем обновляется документация и процессы контроля.

F6 ASM TRY позволяет специалистам по ИБ проверять устойчивость инфраструктуры ко внешним атакам на практике: проводить брутфорс-проверки протоколов, сканировать порты, искать открытые директории, а также тестировать эксплуатацию найденных уязвимостей, в том числе с использованием собственного кода.

По заявлению разработчика, сканирование проводится в контролируемом режиме, не нарушает работу исследуемых ресурсов и выполняется только с согласия организации.

В F6 отмечают, что сочетание пассивного мониторинга и активного тестирования даёт более полное понимание состояния внешнего периметра. Сервис уже зарегистрирован в Едином реестре российского ПО как часть решения F6 Attack Surface Management.

RSS: Новости на портале Anti-Malware.ru