Группа исследователей из AIRI, МТУСИ, «Сбера» и VeinCV представила новый метод защиты голосовых данных. Технология предотвращает сбор биометрии и её последующее использование для генерации дипвойсов.
Разработка опубликована в открытом доступе, а также принята к публикации на конференции Interspeech 2025, которая пройдёт в Роттердаме.
Метод основан на использовании универсальных состязательных патчей, встроенных в аудиофайлы перед их публикацией. Эти патчи препятствуют работе алгоритмов, предназначенных для сбора и анализа голосовой биометрии.
Именно такие алгоритмы применяются для автоматического получения голосовых образцов, которые могут использоваться для обхода систем идентификации, создания дипвойсов или скрытого сбора информации о людях и организациях без их согласия. Особенно уязвимы в этом контексте цифровые аудиозаписи — подкасты, лекции, интервью, архивы вебинаров и конференций.
Внедрение патчей делает голосовые данные неидентифицируемыми для автоматизированных систем, при этом не ухудшая качество звука. Технология не мешает работе сервисов транскрибирования, перевода и поиска, и может применяться к аудиофайлам любой длины.
«Наша цель — усилить методологию защиты цифрового следа человека в публичном пространстве, прежде всего — его голосовой идентичности. Разработанное решение позволяет свободно делиться аудиоконтентом, значительно снижая риск того, что голос станет сырьём для несанкционированного сбора биометрии или создания дипфейков», — отметил Олег Рогов, к.ф.-м.н., руководитель лаборатории безопасного ИИ SAIL AIRI–МТУСИ.