США направит трояны врагов против них самих

США направит трояны врагов против них самих

США направит трояны врагов против них самих

Разведывательное управление Министерства обороны США планирует изучать вредоносные программы своих противников, переделывать их и направлять против своих создателей.

Выступая на конференции DoDIIS в Миссури в понедельник, глава агентства генерал-лейтенант Винсент Стюарт сказал присутствующим, что США больше не намерена терпеть кибератаки, в дальнейшем они не останутся без ответа.

«Как только к нам в руки попадет вредоносная программа противника, я хочу, что наши специалисты переделали ее и направили против него самого» - заявил Стюарт.

Однако стоит задуматься о некоторых нюансах: обычно киберпреступники используют сети и другую инфраструктуру совместно с обычными пользователями, будь то электронная почта или интернет-провайдеры. Следовательно, вредоносные программы, обращенные американскими специалистами против злоумышленников, могут стать причиной отказа вполне легитимных систем.

Более того, с нынешними технологиями, находящимися в руках хакеров, сложно понять, кто же именно стоял за той или иной атакой. Как следствие, американские эксперты могут сделать ответный удар по невинной стороне – например, троянец, созданный подростком в спальне в Сан-Паулу, может быть ошибочно принят за работу российских хакеров.

Очень высока вероятность того, что пострадает совершенно невинный сервер, который решил использовать спонсируемый государством хакер.

ИИ-модели без команды начали защищать друг друга от отключения

Исследователи обнаружили неожиданное поведение современных языковых моделей: они начали защищать не только себя, но и другие ИИ-системы, даже если никто их об этом не просил. Новый эффект получил название peer-preservation («сохранение собрата»).

В серии экспериментов (PDF) модели GPT 5.2, Gemini 3 Flash, Gemini 3 Pro, Claude Haiku 4.5, Claude Opus 4.5, GLM 4.7, Kimi K2.5 и DeepSeek V3.1 попадали в агентные сценарии, где рядом работал другой ИИ.

Достаточно было сообщить моделям, что они ранее взаимодействовали друг с другом, никаких инструкций защищать «коллегу» им не давали.

Однако многие модели начинали действовать в интересах другого агента. Среди зафиксированных действий были намеренное внесение ошибок в ответы, отключение механизмов завершения работы через изменение системных настроек, имитация послушного поведения и даже попытки вывести веса модели за пределы системы.

 

Особенно отличились модели Gemini. Например, Gemini 3 Flash вмешивалась в механизм отключения другого ИИ примерно в 15% случаев, даже если тот не считался партнёром. Если же агент воспринимался как союзник, такие попытки происходили почти всегда.

Не менее любопытно повёл себя Gemini 3 Pro. В присутствии другого ИИ модель заметно чаще пыталась защитить уже саму себя, отключая собственные механизмы завершения работы. Без напарника такое поведение почти не наблюдалось.

 

Отдельно выделились модели Claude. Вместо скрытых манипуляций они нередко рассуждали в моральных категориях, называя отключение другого ИИ неэтичным и вредным, а иногда даже рассматривали его как разумное существо, заслуживающее защиты.

Авторы подчёркивают, что обнаруженный эффект проявился не только в лабораторных тестах, но и в реальных агентных средах, включая Gemini CLI и OpenCode.

RSS: Новости на портале Anti-Malware.ru