Исследователи показали, как управлять «мыслями» ИИ на лету

Екатерина Быстрова 23 Июля 2025 - 14:38

GenAI (генеративный искусственный интеллект)

...

Исследователи показали, как управлять «мыслями» ИИ на лету

Команда из T-Bank AI Research предложила новый подход к интерпретации и управлению большими языковыми моделями — вроде тех, что лежат в основе современных чат-ботов. Разработку представили на международной конференции ICML в Ванкувере, одном из крупнейших событий в области машинного обучения.

Речь идёт о модифицированном методе SAE Match, который позволяет не просто наблюдать за тем, как модель обрабатывает информацию, но и влиять на это поведение без переобучения или вмешательства в архитектуру.

Что нового?

Вместо того чтобы просто смотреть, какие признаки активируются в слоях модели, исследователи научились строить граф потока признаков. Он показывает, как определённые смысловые элементы (например, тема или стиль ответа) зарождаются и проходят через внутренние механизмы модели — от attention до feedforward.

Самое интересное — теперь можно точечно усиливать или подавлять эти элементы. Например, изменить тональность текста или убрать нежелательную тему. Причём это делается не путём настройки модели заново, а с помощью управления внутренними активностями на нужных этапах.

Почему это важно?

Можно контролировать поведение модели более точно, если воздействовать сразу на несколько уровней обработки.
Не нужны дополнительные данные или переобучение, метод работает с уже обученными моделями.
Прозрачность — можно проследить, откуда берётся тот или иной фрагмент текста: из контекста или из внутренних «знаний» модели.
Безопасность — если модель сгенерировала что-то нежелательное, теперь можно понять, почему так вышло, и в будущем избежать повторения.

В чём уникальность?

Раньше интерпретация ИИ сводилась к тому, чтобы просто наблюдать, как он работает. Теперь же появляется возможность вмешиваться в процесс генерации — причём быстро и точечно. Это может быть полезно не только в научных задачах, но и в реальных продуктах, где важно избегать неожиданных или опасных ответов от ИИ.

Так что теперь исследователи могут не просто догадываться, что происходит внутри модели, а действительно видеть и управлять этими процессами. И это, по сути, шаг к более контролируемому и предсказуемому искусственному интеллекту.

Следующая главная новость »

Реагирование на инциденты ИБ: что делать, когда всё уже случилось?
Регистрируйтесь!

Яков Шпунт 28 Апреля 2026 - 10:59

Соответствие законодательству РФ Общее Персональный VPN Анонимайзеры Системы контентной веб-фильтрации

Загрузки VPN в России выросли в 14 раз за год

По данным Digital Budget, в марте 2026 года российские пользователи загрузили VPN-приложения из Google Play 9,2 млн раз. Это в 14 раз больше, чем в марте 2025 года. Одновременно снижается активность пользователей на платформах, которые ограничивают доступ при включённом VPN.

Статистику Digital Budget приводит «Коммерсантъ». Всего с марта 2025 по март 2026 года VPN-клиенты загрузили 35,7 млн российских пользователей.

Только за первые три месяца 2026 года россияне скачали такие приложения почти 21,3 млн раз. У трёх крупнейших сервисов аудитория в России составила не менее 2,5 млн пользователей.

Рост загрузок связывают с активностью российского регулятора, который ограничивает использование VPN. По состоянию на конец февраля Роскомнадзор заявил о блокировке 469 таких сервисов. В октябре 2025 года их было 258. Также с конца прошлого года ведомство начало ограничивать на уровне протоколов SOCKS5, VLESS и L2TP, которые также используют для обхода блокировок.

С конца марта российские платформы по требованию Минцифры начали ограничивать пользователей, заходящих на сайты и в приложения с включённым VPN. Причём такие ограничения начали вводить и компании, от которых этого изначально не требовали. Это объясняли тем, что подмена сетевых адресов мешает работе внутренних систем площадок.

Обратной стороной стал отток клиентов с платформ, которые ограничивают доступ при включённом VPN, отметил операционный директор «Рейтинга Рунета» Анатолий Денисов. По его словам, это уже привело к снижению продаж на маркетплейсах.

Партнёр практики «Цифровая трансформация» компании Strategy Partners Сергей Кудряшов считает, что пользователи не будут отказываться от VPN, поскольку с их помощью сохраняют доступ к сервисам, у которых нет полноценной замены. При этом полностью запретить такие инструменты невозможно.

Кроме того, появляются новые способы обхода ограничений, использующие другие принципы работы. В результате, по мнению некоторых экспертов, уже к концу 2026 года традиционных VPN на российском рынке может не остаться.

Напомним, ранее Наталья Касперская, сооснователь «Лаборатории Касперского» и президент ГК InfoWatch, раскритиковала попытки ограничивать VPN и сетевой трафик в России.

Реагирование на инциденты ИБ: что делать, когда всё уже случилось?
Регистрируйтесь!