Хакеры взломали базу данных полиции Шанхая и украли ПДн миллиарда китайцев

Хакеры взломали базу данных полиции Шанхая и украли ПДн миллиарда китайцев

Хакеры взломали базу данных полиции Шанхая и украли ПДн миллиарда китайцев

В даркнете выставлены на продажу 1 млрд записей с ПДн граждан Китая. Неизвестные хакеры уверяют, что они взломали базу данных полиции Шанхая и украли более 23 Тбайт данных.

Со слов продавца, записи содержат такую информацию, как имя, адрес, место рождения, номер удостоверения личности, номер телефона и данные уголовного дела. За весь дамп злоумышленники просят 10 биткоинов (порядка $196 тыс. по текущему курсу).

Объявление о продаже обнаружили на подпольном форуме наблюдатели из Binance. В своем твите они не стали уточнять, где именно произошла утечка, отметив лишь, что это «одна из азиатских стран», и виной тому, вероятно, уязвимость базы данных Elasticsearch, которой пользуется некий госорган.

Подобное предположение выдвинуто не без оснований: слабая защита облачных хранилищ стала притчей во языцех. В данном случае речь может идти об облаке Alibaba, Tencent или Huawei — крупнейших провайдеров в стране.

Китайское ИБ-сообщество в замешательстве: если заявление хакеров верно, это крупнейшая за всю историю утечка в КНР. Каким образом злоумышленникам удалось получить доступ к столь внушительной базе данных, можно только гадать. Власти Шанхая и Администрация киберпространства Китая пока не комментируют случившееся.

По китайским законам, раскрытие персональных данных может обернуться тюремным сроком. Одиозная находка заставила операторов криптобиржи Binance ужесточить верификацию пользователей, потенциально попавших под раздачу.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

В открытый доступ выложили модель T-one для распознавания речи на русском

Центр искусственного интеллекта группы «Т-Технологии» опубликовал на GitHub и Hugging Face свою модель потокового распознавания речи на русском языке под названием T-one. Это компактная ASR-модель (около 70 млн параметров), которая ориентирована на работу с аудио в реальном времени.

Особенно хорошо она показывает себя на сложных данных — например, шумных или сжатых записях из колл-центров. Именно в таких ситуациях ошибки распознавания особенно критичны для бизнеса.

Модель подходит для сценариев, где важно обрабатывать речь «на лету» — звонки, голосовые ассистенты, системы автоматизации поддержки. У неё низкая задержка и возможность работать с аудиопотоками произвольной длины.

T-one уже используется во внутренних сервисах группы «Т-Технологии» — например, в колл-центрах Т-Банка, мобильном секретаре Т-Мобайла, в системах защиты от спам-звонков и других проектах.

 

Открытых и качественно размеченных датасетов для распознавания речи в русскоязычной телефонии пока нет, но, по внутренним оценкам компании, T-one обходит по качеству более крупные открытые модели, такие как GigaAM v2 (242 млн параметров) и Whisper Large-v3 (1,5 млрд параметров).

Модель можно запускать на обычных серверах — она не требует мощного и дорогого оборудования. Это может быть полезно тем, кто хочет внедрить автоматическое распознавание речи, но не готов платить за облачные решения или дорогие лицензии.

В открытом доступе опубликованы не только веса модели, но и код, который можно использовать для адаптации под собственные задачи или работы в высоконагруженных системах. Лицензия — Apache 2.0, то есть разрешено и коммерческое использование, и любые модификации.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru