Innostage отразила в августе более 30 тысяч кибератак

Innostage отразила в августе более 30 тысяч кибератак

Innostage отразила в августе более 30 тысяч кибератак

С начала открытых кибериспытаний в формате Bug Bounty, которые стартовали 26 мая, на веб-приложения компании было совершено более 360 тысяч атак. Пик – более 320 тысяч – пришелся на июль. В августе удалось отразить более 30 тысяч нападений.

Innostage проводить кибериспытания для проверке устойчивости ИТ-инфраструктуры. В их рамках исследователи должны совершить недопустимое событие.

Максимальное - 5 млн руб – ждет того, кто сумеет перевести денежную сумму со счета компании. Оплачиваются также промежуточные действия, например, завладение корпоративной учетной записью с закреплением на рабочей станции.

В ходе отражения атак специалисты компании заблокировали несколько десятков IP-адресов, выявленных в ходе как автоматического, так и ручного анализа, например, с помощью правил корреляции событий.

«Наши аналитики отмечают, что хакеры сменили тактику. Они перешли от разведки инфраструктуры компании к более агрессивным действиям и стали активно воздействовать на ее публичные ресурсы. Также исследователи начали автоматизировать отдельные этапы атак и пытаться получить доступ к публичным серверам, используя различные наборы скриптов», — отметил Руслан Сулейманов, директор по цифровой трансформации компании Innostage.

ИИ-модели без команды начали защищать друг друга от отключения

Исследователи обнаружили неожиданное поведение современных языковых моделей: они начали защищать не только себя, но и другие ИИ-системы, даже если никто их об этом не просил. Новый эффект получил название peer-preservation («сохранение собрата»).

В серии экспериментов (PDF) модели GPT 5.2, Gemini 3 Flash, Gemini 3 Pro, Claude Haiku 4.5, Claude Opus 4.5, GLM 4.7, Kimi K2.5 и DeepSeek V3.1 попадали в агентные сценарии, где рядом работал другой ИИ.

Достаточно было сообщить моделям, что они ранее взаимодействовали друг с другом, никаких инструкций защищать «коллегу» им не давали.

Однако многие модели начинали действовать в интересах другого агента. Среди зафиксированных действий были намеренное внесение ошибок в ответы, отключение механизмов завершения работы через изменение системных настроек, имитация послушного поведения и даже попытки вывести веса модели за пределы системы.

 

Особенно отличились модели Gemini. Например, Gemini 3 Flash вмешивалась в механизм отключения другого ИИ примерно в 15% случаев, даже если тот не считался партнёром. Если же агент воспринимался как союзник, такие попытки происходили почти всегда.

Не менее любопытно повёл себя Gemini 3 Pro. В присутствии другого ИИ модель заметно чаще пыталась защитить уже саму себя, отключая собственные механизмы завершения работы. Без напарника такое поведение почти не наблюдалось.

 

Отдельно выделились модели Claude. Вместо скрытых манипуляций они нередко рассуждали в моральных категориях, называя отключение другого ИИ неэтичным и вредным, а иногда даже рассматривали его как разумное существо, заслуживающее защиты.

Авторы подчёркивают, что обнаруженный эффект проявился не только в лабораторных тестах, но и в реальных агентных средах, включая Gemini CLI и OpenCode.

RSS: Новости на портале Anti-Malware.ru