В открытый доступ выложили модель T-one для распознавания речи на русском

В открытый доступ выложили модель T-one для распознавания речи на русском

В открытый доступ выложили модель T-one для распознавания речи на русском

Центр искусственного интеллекта группы «Т-Технологии» опубликовал на GitHub и Hugging Face свою модель потокового распознавания речи на русском языке под названием T-one. Это компактная ASR-модель (около 70 млн параметров), которая ориентирована на работу с аудио в реальном времени.

Особенно хорошо она показывает себя на сложных данных — например, шумных или сжатых записях из колл-центров. Именно в таких ситуациях ошибки распознавания особенно критичны для бизнеса.

Модель подходит для сценариев, где важно обрабатывать речь «на лету» — звонки, голосовые ассистенты, системы автоматизации поддержки. У неё низкая задержка и возможность работать с аудиопотоками произвольной длины.

T-one уже используется во внутренних сервисах группы «Т-Технологии» — например, в колл-центрах Т-Банка, мобильном секретаре Т-Мобайла, в системах защиты от спам-звонков и других проектах.

 

Открытых и качественно размеченных датасетов для распознавания речи в русскоязычной телефонии пока нет, но, по внутренним оценкам компании, T-one обходит по качеству более крупные открытые модели, такие как GigaAM v2 (242 млн параметров) и Whisper Large-v3 (1,5 млрд параметров).

Модель можно запускать на обычных серверах — она не требует мощного и дорогого оборудования. Это может быть полезно тем, кто хочет внедрить автоматическое распознавание речи, но не готов платить за облачные решения или дорогие лицензии.

В открытом доступе опубликованы не только веса модели, но и код, который можно использовать для адаптации под собственные задачи или работы в высоконагруженных системах. Лицензия — Apache 2.0, то есть разрешено и коммерческое использование, и любые модификации.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Минцифры анонсировало ужесточение порядка сбора персданных

Ужесточение правил сбора персональных данных должно помочь избежать избыточного накопления информации и, как следствие, снизить риски утечек. Сейчас документ находится на стадии согласования с другими государственными органами.

Как сообщил врио директора департамента обеспечения кибербезопасности Минцифры Евгений Хасин на пресс-конференции «Кибербезопасность: вызовы и шаги по борьбе с угрозами», ведомство подготовило законопроект, цель которого — сократить объёмы персональных данных, собираемых организациями.

«В системах не должно обрабатываться больше персональных данных, чем необходимо для конкретного бизнес-процесса, — отметил Евгений Хасин. — Многие компании стремятся собирать максимум информации для дальнейшего использования, но в законе закреплён принцип минимизации».

Впервые эта задача была обозначена ещё в 2023 году. Тогда директор департамента обеспечения кибербезопасности Минцифры Владимир Бенгин подчёркивал необходимость сокращать объём используемых персональных данных или хотя бы шифровать их идентификаторы. Он называл это «первичной» мерой до внедрения любых других способов защиты.

Директор по развитию центра мониторинга внешних цифровых угроз Solar Aura (ГК «Солар») Александр Вураско обратил внимание на тревожную статистику. За восемь месяцев 2025 года объём утекших данных оказался в четыре раза больше, чем за весь 2024 год, хотя количество самих инцидентов уменьшилось. По его словам, один масштабный случай способен резко изменить картину. Согласно данным за первое полугодие 2025 года, объём утечек был вдвое меньше, чем за аналогичный период годом ранее.

По мнению экспертов эфира AM Live «Защита данных от утечек и несанкционированного доступа», именно компрометация персональных данных вызывает наибольший общественный резонанс и наносит компаниям наиболее серьёзный ущерб.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru