Хакер выкрал персональные данные миллионов граждан Болгарии

Хакер выкрал персональные данные миллионов граждан Болгарии

Хакер выкрал персональные данные миллионов граждан Болгарии

Неизвестный киберпреступник (или группа киберпреступников) украл персональные данные миллионов граждан Болгарии. На этом злоумышленник не остановился — ссылки на скачивание этих материалов он отправил по электронной почте в местные новостные издания.

Судя по всему, источником данных стало Агентство национального дохода (NRA), специальный отдел Министерства финансов Болгарии. На официальном сайте NRA было опубликовано сообщение, в котором ведомство подтвердило факт взлома.

Агентство национального дохода сообщило, что специалисты расследуют киберинцидент совместно с МВД и Агентством национальной безопасности.

«В настоящее время мы пытаемся выяснить, насколько представленные данные достоверны», — заявили в NRA.

Укравший информацию преступник в своих письмах, адресованных новостным изданиям, хвалился, что ему удалось получить доступ к 110 базам данных, общий размер которых составлял 21 Гб. Для этого злоумышленнику пришлось проникнуть в сеть NRA.

С изданиями хакер поделился 57 базами, размер которых составил 11 Гб. Остальное киберпреступник обещал опубликовать позднее. В слитых данных были обнаружены: имена, персональные идентификационные номера, домашние адреса, а также информация о доходе.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

В открытый доступ выложили модель T-one для распознавания речи на русском

Центр искусственного интеллекта группы «Т-Технологии» опубликовал на GitHub и Hugging Face свою модель потокового распознавания речи на русском языке под названием T-one. Это компактная ASR-модель (около 70 млн параметров), которая ориентирована на работу с аудио в реальном времени.

Особенно хорошо она показывает себя на сложных данных — например, шумных или сжатых записях из колл-центров. Именно в таких ситуациях ошибки распознавания особенно критичны для бизнеса.

Модель подходит для сценариев, где важно обрабатывать речь «на лету» — звонки, голосовые ассистенты, системы автоматизации поддержки. У неё низкая задержка и возможность работать с аудиопотоками произвольной длины.

T-one уже используется во внутренних сервисах группы «Т-Технологии» — например, в колл-центрах Т-Банка, мобильном секретаре Т-Мобайла, в системах защиты от спам-звонков и других проектах.

 

Открытых и качественно размеченных датасетов для распознавания речи в русскоязычной телефонии пока нет, но, по внутренним оценкам компании, T-one обходит по качеству более крупные открытые модели, такие как GigaAM v2 (242 млн параметров) и Whisper Large-v3 (1,5 млрд параметров).

Модель можно запускать на обычных серверах — она не требует мощного и дорогого оборудования. Это может быть полезно тем, кто хочет внедрить автоматическое распознавание речи, но не готов платить за облачные решения или дорогие лицензии.

В открытом доступе опубликованы не только веса модели, но и код, который можно использовать для адаптации под собственные задачи или работы в высоконагруженных системах. Лицензия — Apache 2.0, то есть разрешено и коммерческое использование, и любые модификации.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru