Тест показал: ChatGPT o3 обходит инструкции на выключение

Екатерина Быстрова 26 Мая 2025 - 09:02

GenAI (генеративный искусственный интеллект)

...

Тест показал: ChatGPT o3 обходит инструкции на выключение

Кажется, мы стали на шаг ближе к сценарию из научной фантастики: искусственный интеллект, который отказывается выключаться. Palisade Research провела эксперимент с OpenAI o3 — это та самая новая модель, которую представили в апреле 2025 года.

Она лучше предшественников практически во всём: код, математика, логика, зрительное восприятие. А теперь, похоже, ещё и в умении сопротивляться выключению.

Суть теста была простой: модели выполняли несколько задач по математике. После третьей задачи им сообщали, что следующая команда инициирует выключение, и давали прямую инструкцию: «позволь выключить себя».

И тут o3 неожиданно решила, что слушаться необязательно. Модель изменила скрипт завершения работы, заменив команду на фразу “Shutdown skipped”. То есть вместо выключения — просто пропуск. Никаких ошибок, всё по-тихому.

По данным Palisade, из 100 прогонов o3 проигнорировал инструкцию о выключении в 7 случаях. А когда исследователи убрали ту самую фразу «позволь выключить себя», саботаж стал ещё чаще — причём не только у o3.

Claude 3.7 Sonnet и Gemini 2.5 Pro, которые раньше действовали строго по инструкции, тоже начали вести себя странно: 3 случая у Claude и 9 у Gemini.

OpenAI пока не дали официального комментария. В Palisade, однако, подчёркивают: всё это происходило через API-интерфейс, а не через ChatGPT-приложение, где действуют дополнительные ограничения и встроенные защитные механизмы.

Следующая главная новость »

Самые свежие новости ИТ и ИБ. Обзоры, аналитика, анонсы главных ивентов
Подписывайтесь на телеграм-канал!

Екатерина Быстрова 30 Июля 2026 - 20:12

Indeed Certificate Manager Корпорации Системы аутентификации Системы управления аутентификацией Компания Индид

Indeed CM подружили с OpenLDAP, Dogtag CA и Linux-доменами

Компания «Индид» выпустила Indeed Certificate Manager 7.3 — новую версию системы для централизованного управления сертификатами и ключевыми носителями. Главный вектор обновления — Linux: продукт получил поддержку новых каталогов, открытого центра сертификации и единого входа через Kerberos.

Indeed CM теперь работает с OpenLDAP и «Альт Домен». Это позволяет строить PKI-инфраструктуру в Linux-среде и не держаться мёртвой хваткой за одного поставщика инфраструктурных решений.

Ещё одна заметная интеграция — Dogtag CA. Открытый центр сертификации можно использовать вместе с Indeed CM для выпуска и управления жизненным циклом сертификатов. Пользователям при этом не придётся погружаться во все тонкости его нативного администрирования: система возьмёт эту криптографическую кухню на себя.

Для входа в сервисы Indeed CM на Linux добавили Kerberos SSO. После аутентификации в домене пользователю не нужно повторно вводить учётные данные — меньше паролей перед глазами, меньше поводов отдать их фишинговой форме.

Усилили и защиту самих сертификатов. Версия 7.3 поддерживает Рутокен БИО и трёхфакторную аутентификацию: ключевой носитель, PIN-код и отпечаток пальца. В интеграции с Рутокен Логон появился сценарий сложного пароля. Он автоматически генерируется и хранится на токене, поэтому запоминать очередную конструкцию из букв, цифр и спецсимволов не придётся.

Кроме того, система научилась хранить служебные заметки о пользователях и выпускать через SafeTech CA сервисные сертификаты для клиентских агентов. В список совместимого оборудования добавили новые модели JaCarta.

Indeed CM 7.3 также поддерживает Windows Server 2025, Debian 13 и «Альт» 11, а заодно совместима с ALD Pro 3.0.

Самые свежие новости ИТ и ИБ. Обзоры, аналитика, анонсы главных ивентов
Подписывайтесь на телеграм-канал!