Утечка Verifications.io набрала в общей сумме 2 млрд записей

Утечка Verifications.io набрала в общей сумме 2 млрд записей

Утечка Verifications.io набрала в общей сумме 2 млрд записей

Сервис валидации адресов электронной почты Verifications.io пострадал от серьезной утечки — была скомпрометирована огромная база данных, содержащая персональные данные более чем 2 миллиардов пользователей по всему миру.

Началось все 7 марта 2019 года, когда эксперт в области безопасности Боб Дьяченко опубликовал пост в блоге, в котором утверждалось, что специалисту удалось обнаружить незащищенную базу MongoDB.

Объем этой базы был равен 150 Гб, а следы вели к Verifications.io. В общей сложности там было более 800 миллионов записей.

После этого Дьяченко объединился с Троем Хантом (создателем HaveIbeenPwned), чтобы проанализировать скомпрометированную информацию. В результате эксперты выяснили, что среди утекших данных есть имена, физические адреса, номера телефонов, имейлы, даты рождения, пол, должность, местоположение и IP-адреса.

Дьяченко рассортировал данные следующим образом:

  • Утекшие имейлы — 798 171 891 записей.
  • Имейлы с номерами телефонов — 4 150 600 записей.
  • Бизнес-информация — 6 217 358 записей.

К счастью, среди скомпрометированной информации не было паролей пользователей. Дьяченко довольно оперативно уведомил Verifications.io об утечке, с тех пор домен был выведен в офлайн.

Чуть позже специалисты компании DynaRisk, занимающейся кибербезопасностью, заявили, что утечка затрагивает куда больший объем данных, чем было принято считать изначально — более 2 миллиардов записей, именно столько насчитали эксперты.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Google представил VaultGemma — LLM с дифференциальной приватностью

В семействе больших языковых моделей (БЯМ, LLM) с открытым кодом, разработанных в Google, прибавление. Новинка VaultGemma не запоминает конфиденциальные данные при обучении, что предотвращает их слив пользователям.

ИИ-модель, построенная на базе Gemma 2 и работающая по 1 млрд параметров, прошла предварительный тренинг с применением метода дифференциальной приватности (differential privacy) — он добавляет в процесс обучения эталонный шум для ограничения возможности запоминания.

К сожалению, такой подход снижает не только риск утечки конфиденциальных данных, но также точность и быстродействие LLM. Чтобы найти оптимальный баланс между приватностью, практичностью и затратами на вычисления, в Google провели специальное исследование.

Бенчмаркинг показал, что по производительности VaultGemma сравнима с моделями той же величины, но без гарантий конфиденциальности.

 

Подробная информация о новом opensource-проекте, способном ускорить создание приватных и безопасных ИИ-систем для медучреждений, финансовых институтов и госсектора, выложена на Hugging Face и Kaggle.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru