База в облаке Microsoft раскрыла данные о доходе миллионов американцев

База в облаке Microsoft раскрыла данные о доходе миллионов американцев

База в облаке Microsoft раскрыла данные о доходе миллионов американцев

В облачном сервисе Microsoft была обнаружена база данных, содержащая информацию о 80 миллионах американских семей. Эта цифра превышает 50% всех семейств, проживающих на территории США. Незащищенные данные обнаружили исследователи vpnMentor.

Общий размер базы данных составляет 24 Гб, на данный момент неизвестно, что за компания оставила их в таком виде в Сети. Эксперты проводят свое независимое расследование, чтобы выйти на владельца базы.

Интересен тот факт, что данные были составлены в формате целых семей, а не отдельных физических лиц — как это бывает обычно. Согласно отчету vpnMentor опубликованная информация включала:

  • Полные адреса (улицы, города, страны, штаты, почтовые индексы).
  • Точные географические координаты.
  • Полные имена — фамилии, имена, отчества.
  • Возраст.
  • Даты рождения.

Эти данные были представлены в легко читаемом виде. Помимо этого, база содержала закодированную информацию в форме числовых значений. Среди таких данных были следующие:

  • Пол.
  • Семейное положение.
  • Доход.
  • Тип жилища.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Google представил VaultGemma — LLM с дифференциальной приватностью

В семействе больших языковых моделей (БЯМ, LLM) с открытым кодом, разработанных в Google, прибавление. Новинка VaultGemma не запоминает конфиденциальные данные при обучении, что предотвращает их слив пользователям.

ИИ-модель, построенная на базе Gemma 2 и работающая по 1 млрд параметров, прошла предварительный тренинг с применением метода дифференциальной приватности (differential privacy) — он добавляет в процесс обучения эталонный шум для ограничения возможности запоминания.

К сожалению, такой подход снижает не только риск утечки конфиденциальных данных, но также точность и быстродействие LLM. Чтобы найти оптимальный баланс между приватностью, практичностью и затратами на вычисления, в Google провели специальное исследование.

Бенчмаркинг показал, что по производительности VaultGemma сравнима с моделями той же величины, но без гарантий конфиденциальности.

 

Подробная информация о новом opensource-проекте, способном ускорить создание приватных и безопасных ИИ-систем для медучреждений, финансовых институтов и госсектора, выложена на Hugging Face и Kaggle.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru