Исследователи показали, как управлять «мыслями» ИИ на лету

Исследователи показали, как управлять «мыслями» ИИ на лету

Исследователи показали, как управлять «мыслями» ИИ на лету

Команда из T-Bank AI Research предложила новый подход к интерпретации и управлению большими языковыми моделями — вроде тех, что лежат в основе современных чат-ботов. Разработку представили на международной конференции ICML в Ванкувере, одном из крупнейших событий в области машинного обучения.

Речь идёт о модифицированном методе SAE Match, который позволяет не просто наблюдать за тем, как модель обрабатывает информацию, но и влиять на это поведение без переобучения или вмешательства в архитектуру.

Что нового?

Вместо того чтобы просто смотреть, какие признаки активируются в слоях модели, исследователи научились строить граф потока признаков. Он показывает, как определённые смысловые элементы (например, тема или стиль ответа) зарождаются и проходят через внутренние механизмы модели — от attention до feedforward.

Самое интересное — теперь можно точечно усиливать или подавлять эти элементы. Например, изменить тональность текста или убрать нежелательную тему. Причём это делается не путём настройки модели заново, а с помощью управления внутренними активностями на нужных этапах.

Почему это важно?

  • Можно контролировать поведение модели более точно, если воздействовать сразу на несколько уровней обработки.
  • Не нужны дополнительные данные или переобучение, метод работает с уже обученными моделями.
  • Прозрачность — можно проследить, откуда берётся тот или иной фрагмент текста: из контекста или из внутренних «знаний» модели.
  • Безопасность — если модель сгенерировала что-то нежелательное, теперь можно понять, почему так вышло, и в будущем избежать повторения.

В чём уникальность?

Раньше интерпретация ИИ сводилась к тому, чтобы просто наблюдать, как он работает. Теперь же появляется возможность вмешиваться в процесс генерации — причём быстро и точечно. Это может быть полезно не только в научных задачах, но и в реальных продуктах, где важно избегать неожиданных или опасных ответов от ИИ.

Так что теперь исследователи могут не просто догадываться, что происходит внутри модели, а действительно видеть и управлять этими процессами. И это, по сути, шаг к более контролируемому и предсказуемому искусственному интеллекту.

В BootROM старых iPhone нашли уязвимость, которую нельзя закрыть патчем

Исследователи из Paradigm Shift раскрыли подробности новой аппаратной уязвимости iPhone под названием usbliter8. Главная проблема в том, что исправить её обычным обновлением iOS уже невозможно. Уязвимость находится в BootROM — самом низком уровне загрузки устройства, который записывается в чип ещё на этапе производства.

Под удар попали устройства на процессорах Apple A12 и A13, а также некоторые модели Apple Watch и HomePod mini.

В список входят iPhone XR, XS, XS Max, вся линейка iPhone 11, iPhone SE второго поколения, а также несколько моделей iPad.

Атака требует физического доступа к устройству. Для эксплуатации смартфон необходимо перевести в режим DFU, после чего через USB отправить специально подготовленные данные. Они вызывают сбой в работе USB-контроллера и позволяют записать информацию в неправильную область памяти.

 

Дальше начинается самое интересное. Получив контроль над процессом загрузки, злоумышленник может запускать собственный код ещё до старта iOS, обходить проверки цифровых подписей и загружать модифицированные версии операционной системы.

Впрочем, есть и хорошая новость. Исследователи подчёркивают, что уязвимость напрямую не затрагивает Secure Enclave — отдельный защищённый модуль Apple, отвечающий за хранение паролей, биометрии и ключей шифрования. То есть данные пользователя и код блокировки устройства остаются защищёнными.

Однако полностью расслабляться не стоит. По словам авторов исследования, usbliter8 может расширить возможности для дальнейших атак и потенциально стать частью более сложных сценариев компрометации устройства.

История напоминает знаменитую уязвимость checkm8, которая много лет назад открыла дорогу целому поколению джейлбрейков для старых iPhone. Поскольку usbliter8 тоже является аппаратной и неустранимой ошибкой, эксперты не исключают появления новых инструментов для взлома совместимых устройств.

Исследователи уже опубликовали техническое описание и демонстрационный эксплойт на GitHub. А владельцам устройств на A12 и A13 дали самый радикальный совет: если угроза кажется серьёзной, единственным стопроцентным способом защиты остаётся переход на более новое железо.

RSS: Новости на портале Anti-Malware.ru