Агрегатор утечке LeakedSource появился около полутора лет назад и за прошедшее время успел привлечь к себе немало внимания. Ресурс обнародовал информацию о множестве крупных утечек данных (например, LinkedIn, «Рамблер», сервисов для взрослых, принадлежащих FriendFinder Networks).
В итоге собрав огромную базу скомпрометированных аккаунтов, превышающую три миллиарда учетных записей. Все это время вселись споры о легальности и этичности подобного бизнеса, ведь доступ к своим базам администрация LeakedSource предоставляла совсем не бесплатно.
26 января 2017 года западные СМИ сообщили, что с LeakedSource происходит нечто странное. Сайт ушел в оффлайн еще два дня тому назад, а его операторы не отвечают ни на какие запросы. Вместе с этим, на форумах ogflip.com пользователь с ником LTD сообщил, что ресурс закрыли правоохранительные органы и ожидать возвращения LeakedSource не стоит, пишет xakep.ru.
«LeakedSource в дауне навечно, он не вернется. У владельца сегодня был обыск, его не арестовали, но все SSD конфискованы, а серверы LeakedSource затребовал суд, они под федеральным следствием. Если он сумеет как-то оправиться от этого и снова запустит LS, значит, я заблуждаюсь. Но я не заблуждаюсь. И, кстати, это не троллинг», — пишет LTD.
Подтвердить или опровергнуть информацию LTD пока никому не удалось: администраторы LeakedSource уже два дня не отвечают ни по одному каналу связи, хотя обычно они реагируют на запросы прессы очень оперативно. Представители Министерства юстиции США от комментариев отказались.
Основатель и владелец другого агрегатора утечек, сайта Have I Been Pwned?, Трой Хант (Troy Hunt) говорит, что вполне готов поверить в такое развитие событий:
«Leaked Source должен был неизбежно столкнуться с последствиями, именно это случается, когда предоставляешь доступ к паролям жертв утечек любому, кто готов за них заплатить. Я был просто шокирован, когда кто-то купил доступ к их сервису и прислал мне мой собственный утекший пароль».
Стоит отметить, что сам Хант умышленно не раскрывает данные о паролях пострадавших пользователей, ни в каком виде, так как глубоко убежден, что такая информация представляет угрозу и может использоваться злоумышленниками.
В семействе больших языковых моделей (БЯМ, LLM) с открытым кодом, разработанных в Google, прибавление. Новинка VaultGemma не запоминает конфиденциальные данные при обучении, что предотвращает их слив пользователям.
ИИ-модель, построенная на базе Gemma 2 и работающая по 1 млрд параметров, прошла предварительный тренинг с применением метода дифференциальной приватности (differential privacy) — он добавляет в процесс обучения эталонный шум для ограничения возможности запоминания.
К сожалению, такой подход снижает не только риск утечки конфиденциальных данных, но также точность и быстродействие LLM. Чтобы найти оптимальный баланс между приватностью, практичностью и затратами на вычисления, в Google провели специальное исследование.
Бенчмаркинг показал, что по производительности VaultGemma сравнима с моделями той же величины, но без гарантий конфиденциальности.
Подробная информация о новом opensource-проекте, способном ускорить создание приватных и безопасных ИИ-систем для медучреждений, финансовых институтов и госсектора, выложена на Hugging Face и Kaggle.
Подписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.
Свидетельство о регистрации СМИ ЭЛ № ФС 77 - 68398, выдано федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) 27.01.2017 Разрешается частичное использование материалов на других сайтах при наличии ссылки на источник. Использование материалов сайта с полной копией оригинала допускается только с письменного разрешения администрации.