Минцифры будет собирать данные о фишинге и утечках из Twitter и Telegram

Минцифры будет собирать данные о фишинге и утечках из Twitter и Telegram

Минцифры будет собирать данные о фишинге и утечках из Twitter и Telegram

Подведомственный Минцифры НИИ «Интеграл» провел аукцион с целью заключить контракт на доработку и модернизацию системы мониторинга фишинговых сайтов и сливе ПДн в интернет. Исполнитель уже определен — единственная заявка поступила от ООО «Рубитех» и она соответствует выдвинутым требованиям.

Тендер был объявлен 29 ноября. Стартовая цена закупки — около 170,7 млн руб., срок окончания работ — 30 сентября 2023 года. Согласно ТЗ, поставщик должен создать несколько новых компонентов ИС и усовершенствовать существующие.

Созданная с инициативы Минцифры система мониторинга фишинговых сайтов и утечки персональных данных собирает, обрабатывает и хранит сведения о такой активности. В задачи ИС также входит обеспечение взаимодействия заинтересованных сторон.

Согласно условиям контракта, для повышения производительности поиска и выявления признаков фишинга должна быть обеспечена возможность подключения новых источников данных. В частности, предполагается расширить список открытых источников до 260 позиций, куда должны в обязательном порядке войти публикации IoC (индикаторов компрометации) в Twitter, репозитории GitHub, Telegram-каналы и публичные анонимайзеры (прокси-сервисы, VPN, Tor).

Фильтрация подозрительных доменов должна осуществляться по следующим признакам:

  • все русскоязычные ресурсы вне зависимости от доменной зоны верхнего уровня;
  • все ресурсы в зонах ответственности (ru, su, рф, рус, москва, дети и т. п.) вне зависимости от языка содержимого сайта;
  • все ресурсы, размещенные на территории РФ вне зависимости от языка сайта и TLD-зоны.

Обновление данных должно осуществляться раз в сутки, при этом количество вновь выявленных фишинговых сайтов и утечек ПДн должны быть не менее 5% от общего количества за предыдущие сутки.

Совершенствование компонента взаимодействия предполагает разработку форматов данных, протоколов и регламентов обмена между ИС и смежными системами. Модуль также должен обеспечивать ведение журналов учета запросов и ответов.

Для подсистемы личных кабинетов планируется разработать справочники инцидентов и нормативно-правовых актов, касающихся фишинга. Предполагается также доработать пользовательский интерфейс ИС и компонент визуализации и отчетности.

Новые разработки в рамках данного контракта:

  • компонент личного кабинета оператора (ЛКО) «Инкубатор» с такими возможностями, как ведение списка ресурсов для мониторинга, определение состояния ресурса по изменению хеш-суммы, сравнение скриншотов страниц старой и новой версий, информирование об изменениях;
  • компонент формирования электронной подписи для обмена информацией об инцидентах через подсистему личных кабинетов с помощью веб-плагинов;
  • компонент анализа графических образов, с возможностью распознавание текста на изображениях;
  • компонент семантического анализа текстов, размещенных на веб-страницах, с возможностью выявления каналов распространения и первоисточников противоправного и опасного контента, а также оперативного редактирования базы знаний.
AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Google представил VaultGemma — LLM с дифференциальной приватностью

В семействе больших языковых моделей (БЯМ, LLM) с открытым кодом, разработанных в Google, прибавление. Новинка VaultGemma не запоминает конфиденциальные данные при обучении, что предотвращает их слив пользователям.

ИИ-модель, построенная на базе Gemma 2 и работающая по 1 млрд параметров, прошла предварительный тренинг с применением метода дифференциальной приватности (differential privacy) — он добавляет в процесс обучения эталонный шум для ограничения возможности запоминания.

К сожалению, такой подход снижает не только риск утечки конфиденциальных данных, но также точность и быстродействие LLM. Чтобы найти оптимальный баланс между приватностью, практичностью и затратами на вычисления, в Google провели специальное исследование.

Бенчмаркинг показал, что по производительности VaultGemma сравнима с моделями той же величины, но без гарантий конфиденциальности.

 

Подробная информация о новом opensource-проекте, способном ускорить создание приватных и безопасных ИИ-систем для медучреждений, финансовых институтов и госсектора, выложена на Hugging Face и Kaggle.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru