В открытый доступ выложили модель T-one для распознавания речи на русском

В открытый доступ выложили модель T-one для распознавания речи на русском

В открытый доступ выложили модель T-one для распознавания речи на русском

Центр искусственного интеллекта группы «Т-Технологии» опубликовал на GitHub и Hugging Face свою модель потокового распознавания речи на русском языке под названием T-one. Это компактная ASR-модель (около 70 млн параметров), которая ориентирована на работу с аудио в реальном времени.

Особенно хорошо она показывает себя на сложных данных — например, шумных или сжатых записях из колл-центров. Именно в таких ситуациях ошибки распознавания особенно критичны для бизнеса.

Модель подходит для сценариев, где важно обрабатывать речь «на лету» — звонки, голосовые ассистенты, системы автоматизации поддержки. У неё низкая задержка и возможность работать с аудиопотоками произвольной длины.

T-one уже используется во внутренних сервисах группы «Т-Технологии» — например, в колл-центрах Т-Банка, мобильном секретаре Т-Мобайла, в системах защиты от спам-звонков и других проектах.

 

Открытых и качественно размеченных датасетов для распознавания речи в русскоязычной телефонии пока нет, но, по внутренним оценкам компании, T-one обходит по качеству более крупные открытые модели, такие как GigaAM v2 (242 млн параметров) и Whisper Large-v3 (1,5 млрд параметров).

Модель можно запускать на обычных серверах — она не требует мощного и дорогого оборудования. Это может быть полезно тем, кто хочет внедрить автоматическое распознавание речи, но не готов платить за облачные решения или дорогие лицензии.

В открытом доступе опубликованы не только веса модели, но и код, который можно использовать для адаптации под собственные задачи или работы в высоконагруженных системах. Лицензия — Apache 2.0, то есть разрешено и коммерческое использование, и любые модификации.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Атаки на SharePoint связали с уязвимостью пятилетней давности

Эксперты «Лаборатории Касперского» разобрали новую волну атак на серверы Microsoft SharePoint и пришли к выводу, что в её основе лежит старая уязвимость пятилетней давности. Исследователи изучили эксплойт ToolShell, который использовался в атаках, и обнаружили сходство с CVE-2020-1147.

Напомним, CVE-2020-1147 — уязвимость, обнаруженная в SharePoint ещё в 2020 году. Похоже, тогда брешь закрыли не до конца, и только обновление 2025 года (CVE-2025-53770) устранило проблему полностью.

Дополнительный анализ показал, что уязвимости CVE-2025-49704 и CVE-2025-49706, которые были закрыты 8 июля, тоже имели общий корень с CVE-2020-1147.

Причём обойти защиту можно было, просто добавив один символ — «/» — в код эксплойта. Microsoft позже выпустила заплатки, устранившие этот обход, и присвоила им отдельные номера.

Атаки на SharePoint фиксировались по всему миру — в том числе в России, Египте, Иордании, Вьетнаме и Замбии. Под удар попали организации из разных сфер: финансы, госсектор, промышленность, а также сельское и лесное хозяйство.

Например, с помощью соответствующего эксплойта киберпреступники атаковали Министерство внутренней безопасности США. То же касается попытки атаки на Национальное управление ядерной безопасности США.

Специалисты напоминают, что старые уязвимости вроде ProxyLogon, PrintNightmare и EternalBlue до сих пор активно используются злоумышленниками.

Если обновления не установлены вовремя, система остаётся уязвимой. С ToolShell, по всей видимости, может случиться то же самое: эксплойт уже опубликован, прост в использовании и, скорее всего, скоро появится в инструментах, которыми пользуются хакеры.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru