В открытый доступ выложили модель T-one для распознавания речи на русском

В открытый доступ выложили модель T-one для распознавания речи на русском

В открытый доступ выложили модель T-one для распознавания речи на русском

Центр искусственного интеллекта группы «Т-Технологии» опубликовал на GitHub и Hugging Face свою модель потокового распознавания речи на русском языке под названием T-one. Это компактная ASR-модель (около 70 млн параметров), которая ориентирована на работу с аудио в реальном времени.

Особенно хорошо она показывает себя на сложных данных — например, шумных или сжатых записях из колл-центров. Именно в таких ситуациях ошибки распознавания особенно критичны для бизнеса.

Модель подходит для сценариев, где важно обрабатывать речь «на лету» — звонки, голосовые ассистенты, системы автоматизации поддержки. У неё низкая задержка и возможность работать с аудиопотоками произвольной длины.

T-one уже используется во внутренних сервисах группы «Т-Технологии» — например, в колл-центрах Т-Банка, мобильном секретаре Т-Мобайла, в системах защиты от спам-звонков и других проектах.

 

Открытых и качественно размеченных датасетов для распознавания речи в русскоязычной телефонии пока нет, но, по внутренним оценкам компании, T-one обходит по качеству более крупные открытые модели, такие как GigaAM v2 (242 млн параметров) и Whisper Large-v3 (1,5 млрд параметров).

Модель можно запускать на обычных серверах — она не требует мощного и дорогого оборудования. Это может быть полезно тем, кто хочет внедрить автоматическое распознавание речи, но не готов платить за облачные решения или дорогие лицензии.

В открытом доступе опубликованы не только веса модели, но и код, который можно использовать для адаптации под собственные задачи или работы в высоконагруженных системах. Лицензия — Apache 2.0, то есть разрешено и коммерческое использование, и любые модификации.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

ФСТЭК России готовит стандарт безопасной разработки систем ИИ

Выступая на BIS Summit 2025, первый замдиректора ФСТЭК России Виталий Лютиков сообщил, что регулятор планирует до конца года вынести на обсуждение проект стандарта привнесения аспекта безопасности в разработку ИИ-систем.

Новое методическое руководство будет представлено как дополнение к действующим нормативам по безопасной разработке программного обеспечения, в том числе ГОСТ Р 56939-2024.

У ИИ-моделей есть своя специфика с точки зрения ИБ — склонность к галлюцинациям, риск утечки конфиденциальных данных и злоупотреблений через манипуляцию промптами, возможность вмешательства в алгоритмы машинного обучения, и ее следует учитывать при создании подобных инструментов.

Приказ ФСТЭК России № 117 от 11.04.2025 об усилении защиты данных в ГИС (заработает с 1 марта будущего года) содержит раздел об ИИ-технологиях, однако изложенные в нем требования по безопасности ограничены эксплуатацией.

Вместе с тем, как и в случае с обычным софтом, не менее важно обезопасить ИИ-системы еще на стадии разработки (такой подход известен как security by design). Новая инициатива регулятора призвана восполнить этот пробел.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru