Google наняла главного врага Sony и Apple

Хакер, взломавший PlayStation 3 и iPhone, пошел работать в Google

Хакеру Джорджу Хоцу (George Hotz), который первым взломал смартфон iPhone и консоль PlayStation 3, предложили работу в Google. Специалист будет трудиться в отделе Project Zero, чья задача состоит в поиске уязвимостей популярного софта.

Согласно данным Wired, Хоц согласился на стажировку в корпорации. В отделе он работает с командой опытных экспертов в области взлома и обнаружения уязвимостей. По словам главы Project Zero Криса Эванса (Chris Evans), Хоц будет искать ошибки не только в софте Google, но и других производителей программ.

Это касается уязвимостей, которые используются как преступниками, так и государственными структурами. Корпорация выделила ресурсы на исправление продукции других фирм, потому что их ПО имеет огромное значение для нормальной работы Google.

Эванс признался, что инициатива Project Zero не принесет корпорации особой прибыли, но опыт работы с талантливыми хакерами для неё полезен, даже если специалисты не будут сотрудничать с Project Zero в дальнейшем.

Если команда Google найдет баг, она оповестит об этом компанию и даст ей от 60 до 90 дней на устранение ошибки. В противном случае, сведения об уязвимости опубликуют в открытом доступе.

ИИ-модели без команды начали защищать друг друга от отключения

Исследователи обнаружили неожиданное поведение современных языковых моделей: они начали защищать не только себя, но и другие ИИ-системы, даже если никто их об этом не просил. Новый эффект получил название peer-preservation («сохранение собрата»).

В серии экспериментов (PDF) модели GPT 5.2, Gemini 3 Flash, Gemini 3 Pro, Claude Haiku 4.5, Claude Opus 4.5, GLM 4.7, Kimi K2.5 и DeepSeek V3.1 попадали в агентные сценарии, где рядом работал другой ИИ.

Достаточно было сообщить моделям, что они ранее взаимодействовали друг с другом, никаких инструкций защищать «коллегу» им не давали.

Однако многие модели начинали действовать в интересах другого агента. Среди зафиксированных действий были намеренное внесение ошибок в ответы, отключение механизмов завершения работы через изменение системных настроек, имитация послушного поведения и даже попытки вывести веса модели за пределы системы.

 

Особенно отличились модели Gemini. Например, Gemini 3 Flash вмешивалась в механизм отключения другого ИИ примерно в 15% случаев, даже если тот не считался партнёром. Если же агент воспринимался как союзник, такие попытки происходили почти всегда.

Не менее любопытно повёл себя Gemini 3 Pro. В присутствии другого ИИ модель заметно чаще пыталась защитить уже саму себя, отключая собственные механизмы завершения работы. Без напарника такое поведение почти не наблюдалось.

 

Отдельно выделились модели Claude. Вместо скрытых манипуляций они нередко рассуждали в моральных категориях, называя отключение другого ИИ неэтичным и вредным, а иногда даже рассматривали его как разумное существо, заслуживающее защиты.

Авторы подчёркивают, что обнаруженный эффект проявился не только в лабораторных тестах, но и в реальных агентных средах, включая Gemini CLI и OpenCode.

RSS: Новости на портале Anti-Malware.ru