В открытый доступ выложили модель T-one для распознавания речи на русском

В открытый доступ выложили модель T-one для распознавания речи на русском

В открытый доступ выложили модель T-one для распознавания речи на русском

Центр искусственного интеллекта группы «Т-Технологии» опубликовал на GitHub и Hugging Face свою модель потокового распознавания речи на русском языке под названием T-one. Это компактная ASR-модель (около 70 млн параметров), которая ориентирована на работу с аудио в реальном времени.

Особенно хорошо она показывает себя на сложных данных — например, шумных или сжатых записях из колл-центров. Именно в таких ситуациях ошибки распознавания особенно критичны для бизнеса.

Модель подходит для сценариев, где важно обрабатывать речь «на лету» — звонки, голосовые ассистенты, системы автоматизации поддержки. У неё низкая задержка и возможность работать с аудиопотоками произвольной длины.

T-one уже используется во внутренних сервисах группы «Т-Технологии» — например, в колл-центрах Т-Банка, мобильном секретаре Т-Мобайла, в системах защиты от спам-звонков и других проектах.

 

Открытых и качественно размеченных датасетов для распознавания речи в русскоязычной телефонии пока нет, но, по внутренним оценкам компании, T-one обходит по качеству более крупные открытые модели, такие как GigaAM v2 (242 млн параметров) и Whisper Large-v3 (1,5 млрд параметров).

Модель можно запускать на обычных серверах — она не требует мощного и дорогого оборудования. Это может быть полезно тем, кто хочет внедрить автоматическое распознавание речи, но не готов платить за облачные решения или дорогие лицензии.

В открытом доступе опубликованы не только веса модели, но и код, который можно использовать для адаптации под собственные задачи или работы в высоконагруженных системах. Лицензия — Apache 2.0, то есть разрешено и коммерческое использование, и любые модификации.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Разработчик фишинг-наборов получил 7 лет за ущерб в $134 млн

Британский суд приговорил 21-летнего студента Олли Холмана к семи годам лишения свободы за создание и распространение инструментов для фишинга, которые использовались киберпреступниками по всему миру. По данным следствия, эти программы нанесли ущерб на сумму более 134 млн долларов.

Холман целенаправленно разрабатывал вредоносные наборы, позволявшие похищать конфиденциальные данные тысяч людей в разных странах.

Как сообщила газета The Guardian, созданные Холманом наборы для фишинга имитировали интерфейсы государственных служб, финансовых организаций и благотворительных фондов. С их помощью злоумышленники получали доступ к личным данным и платёжным реквизитам пользователей из 24 стран.

Всего за период с 2021 по 2023 год Холман разработал 1052 таких набора, копировавших сайты и сервисы 69 различных организаций.

Он продавал их через закрытый канал в Telegram и заработал на этом около 300 тысяч фунтов стерлингов (более 430 тысяч долларов), которые впоследствии отмывал через криптовалютные кошельки.

О Холмане полиции сообщила компания WMC Global, занимающаяся мониторингом угроз в интернете. В октябре 2023 года его задержали в общежитии Университета Кента, где он обучался. Несмотря на арест и прекращение распространения своих фишинговых инструментов, Холман продолжал оказывать техническую поддержку их пользователям. Это стало основанием для повторного задержания в мае 2024 года.

Холман признал вину по семи пунктам обвинения, включая изготовление и продажу средств, предназначенных для совершения мошенничества, содействие преступлениям, а также отмывание доходов, полученных преступным путём.

«Потери от мошенничества, связанные с действиями Холмана, исчисляются миллионами. Более того, сам Холман получил огромную прибыль от продажи этого программного обеспечения, не задумываясь о том, как оно может причинить вред жертвам», — отметил следователь Бен Херли.

Прокурор Королевской прокуратуры Сара Дженнингс выразила надежду, что вынесенный приговор станет предостережением для других авторов вредоносного кода. По её словам, анонимность и защита даркнет-платформ не спасут киберпреступников от ответственности.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru