Исследователи показали, как управлять «мыслями» ИИ на лету

Исследователи показали, как управлять «мыслями» ИИ на лету

Исследователи показали, как управлять «мыслями» ИИ на лету

Команда из T-Bank AI Research предложила новый подход к интерпретации и управлению большими языковыми моделями — вроде тех, что лежат в основе современных чат-ботов. Разработку представили на международной конференции ICML в Ванкувере, одном из крупнейших событий в области машинного обучения.

Речь идёт о модифицированном методе SAE Match, который позволяет не просто наблюдать за тем, как модель обрабатывает информацию, но и влиять на это поведение без переобучения или вмешательства в архитектуру.

Что нового?

Вместо того чтобы просто смотреть, какие признаки активируются в слоях модели, исследователи научились строить граф потока признаков. Он показывает, как определённые смысловые элементы (например, тема или стиль ответа) зарождаются и проходят через внутренние механизмы модели — от attention до feedforward.

Самое интересное — теперь можно точечно усиливать или подавлять эти элементы. Например, изменить тональность текста или убрать нежелательную тему. Причём это делается не путём настройки модели заново, а с помощью управления внутренними активностями на нужных этапах.

Почему это важно?

  • Можно контролировать поведение модели более точно, если воздействовать сразу на несколько уровней обработки.
  • Не нужны дополнительные данные или переобучение, метод работает с уже обученными моделями.
  • Прозрачность — можно проследить, откуда берётся тот или иной фрагмент текста: из контекста или из внутренних «знаний» модели.
  • Безопасность — если модель сгенерировала что-то нежелательное, теперь можно понять, почему так вышло, и в будущем избежать повторения.

В чём уникальность?

Раньше интерпретация ИИ сводилась к тому, чтобы просто наблюдать, как он работает. Теперь же появляется возможность вмешиваться в процесс генерации — причём быстро и точечно. Это может быть полезно не только в научных задачах, но и в реальных продуктах, где важно избегать неожиданных или опасных ответов от ИИ.

Так что теперь исследователи могут не просто догадываться, что происходит внутри модели, а действительно видеть и управлять этими процессами. И это, по сути, шаг к более контролируемому и предсказуемому искусственному интеллекту.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Роскомнадзор сообщил о блокировке звонков в Telegram и WhatsApp

Роскомнадзор объявил о блокировке голосовых вызовов в мессенджерах Telegram и WhatsApp (принадлежит признанной в России экстремистской и запрещённой в стране корпорации Meta). Мера объясняется необходимостью противодействия преступности.

В официальном сообщении регулятора, распространённом по новостным лентам, говорится, что зарубежные мессенджеры стали одним из основных каналов связи, которые используют мошенники. Кроме того, Telegram и WhatsApp, по данным ведомства, активно применяются для вовлечения российских граждан в диверсионно-террористическую деятельность.

«Информируем, что для противодействия преступникам в соответствии с материалами правоохранительных органов принимаются меры по частичному ограничению звонков в данных иностранных мессенджерах. Никаких иных ограничений их функционала не вводится», — отмечается в сообщении Роскомнадзора.

Доступ ко всем функциям, как уточнили в ведомстве, будет восстановлен после выполнения всех требований законодательства.

Как сообщал «Коммерсантъ», выборочная блокировка голосовых вызовов в мессенджерах началась ещё 1 августа. Об этом изданию рассказал источник в телеком-отрасли.

В тот же день председатель комитета Госдумы по развитию гражданского общества, вопросам общественных и религиозных объединений Яна Лантратова направила министру цифрового развития, связи и массовых коммуникаций Максуту Шадаеву запрос с просьбой разъяснить ситуацию в связи с возможной блокировкой звонков через мессенджеры.

Текст письма, оказавшийся в распоряжении ТАСС, содержит просьбу подтвердить или опровергнуть введение ограничений на голосовые и видеозвонки в иностранных сервисах, а также дать официальные комментарии по поводу их работы на территории России.

Первый заместитель председателя комитета Госдумы по информационной политике Антон Ткачёв в комментарии РИА Новости назвал возможную блокировку голосовых вызовов в мессенджерах бесполезной: «Если заблокируют звонки на зарубежных площадках, люди будут так же общаться с помощью российских аналогов или через VPN. Эта мера лишь усложнит жизнь пользователям и вызовет недовольство».

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru