Исследователи показали, как управлять «мыслями» ИИ на лету

Исследователи показали, как управлять «мыслями» ИИ на лету

Исследователи показали, как управлять «мыслями» ИИ на лету

Команда из T-Bank AI Research предложила новый подход к интерпретации и управлению большими языковыми моделями — вроде тех, что лежат в основе современных чат-ботов. Разработку представили на международной конференции ICML в Ванкувере, одном из крупнейших событий в области машинного обучения.

Речь идёт о модифицированном методе SAE Match, который позволяет не просто наблюдать за тем, как модель обрабатывает информацию, но и влиять на это поведение без переобучения или вмешательства в архитектуру.

Что нового?

Вместо того чтобы просто смотреть, какие признаки активируются в слоях модели, исследователи научились строить граф потока признаков. Он показывает, как определённые смысловые элементы (например, тема или стиль ответа) зарождаются и проходят через внутренние механизмы модели — от attention до feedforward.

Самое интересное — теперь можно точечно усиливать или подавлять эти элементы. Например, изменить тональность текста или убрать нежелательную тему. Причём это делается не путём настройки модели заново, а с помощью управления внутренними активностями на нужных этапах.

Почему это важно?

  • Можно контролировать поведение модели более точно, если воздействовать сразу на несколько уровней обработки.
  • Не нужны дополнительные данные или переобучение, метод работает с уже обученными моделями.
  • Прозрачность — можно проследить, откуда берётся тот или иной фрагмент текста: из контекста или из внутренних «знаний» модели.
  • Безопасность — если модель сгенерировала что-то нежелательное, теперь можно понять, почему так вышло, и в будущем избежать повторения.

В чём уникальность?

Раньше интерпретация ИИ сводилась к тому, чтобы просто наблюдать, как он работает. Теперь же появляется возможность вмешиваться в процесс генерации — причём быстро и точечно. Это может быть полезно не только в научных задачах, но и в реальных продуктах, где важно избегать неожиданных или опасных ответов от ИИ.

Так что теперь исследователи могут не просто догадываться, что происходит внутри модели, а действительно видеть и управлять этими процессами. И это, по сути, шаг к более контролируемому и предсказуемому искусственному интеллекту.

Украл цифровой рубль — отвечай как за деньги: ВС обновляет правила

Российское законодательство продолжает подстраиваться под цифровую реальность. Верховный суд РФ подготовил поправки к разъяснениям по делам о краже, грабеже и разбое, в которых впервые прямо указано: предметом хищения могут быть не только наличные деньги и вещи, но и цифровые активы.

Речь идёт о безналичных средствах, цифровых рублях, цифровых правах, бездокументарных ценных бумагах и криптовалюте.

Если раньше вокруг статуса криптовалюты в уголовных делах оставалось немало споров, то теперь Верховный суд предлагает окончательно закрыть этот вопрос. Украл криптовалюту — это такое же хищение имущества, как и кража денег с банковского счёта.

В документе, на который ссылаются «Ведомости», есть и другие важные уточнения. Например, если злоумышленник получил доступ к имуществу через обман или злоупотребление доверием, а само изъятие произошло тайно, такие действия предлагается квалифицировать как кражу.

Отдельно Верховный суд разъяснил момент окончания преступления для безналичных средств. Если речь идёт о деньгах на банковском счёте или электронном кошельке, кража считается завершённой уже в момент списания средств, а не тогда, когда преступник успел ими воспользоваться.

Также предлагается закрепить сложившуюся практику по банковским картам. Если кто-то тайно списал деньги, используя чужую карту, персональные данные или другую конфиденциальную информацию без взлома банковских систем, это следует считать кражей с банковского счёта.

Ещё одно изменение касается серийных списаний. Если злоумышленник несколько раз выводит деньги с одного или нескольких счетов потерпевшего в рамках единого плана, такие действия будут рассматриваться как одно продолжаемое преступление. Наказание в этом случае будет зависеть от общей суммы ущерба.

Юристы отмечают, что революции здесь нет. Российские суды уже давно фактически признавали криптовалюту имуществом и рассматривали её хищение как уголовное преступление. Однако теперь этот подход предлагается официально закрепить и сделать единым для всей судебной практики.

RSS: Новости на портале Anti-Malware.ru