Более 10 млн россиян рискуют раскрыть данные

Более 10 млн россиян рискуют раскрыть данные

Более 10 млн россиян рискуют раскрыть данные

Более 10 млн россиян и российских компаний рискуют раскрыть персональные данные из-за использования поддельных сервисов генеративного искусственного интеллекта (ChatGPT, Dall-E, Midjourney).

Злоумышленники пользуются тем, что жителям России усложнен доступ к данным инструментам из-за проблем с оплатой и ограничений, связанных с санкционной политикой.

Мошенники создают чат-боты и сайты, где обещают предоставить доступ к популярным инструментам. Однако пользователи получают минимальную версию продукта с урезанными функциональными возможностями.

«Пользователи, которые получают доступ к ChatGPT, Dall-E, Midjourney и другим иностранным большим языковым моделям (LLM) через сторонние сервисы, рискуют не только вместо "оригинала" получить открытую модель низкого качества, но и раскрыть свои конфиденциальные данные. Компания считает, что таких людей в России более 10 миллионов», — заявил РИА Новости директор по LLM-продуктам MTS AI Сергей Пономаренко.

Эксперт также предупредил о том, что и использование легальных сервисов сопряжено с рисками раскрытия конфиденциальных данных, которые используются для обучения нейросетей. Это в равной степени относится как к личным данным обычных людей, так и к корпоративной информации компаний.

«Во-первых, подобным сервисам нельзя предоставлять персональные данные и конфиденциальную информацию, содержащую коммерческую тайну. Для работы с корпоративными данными следует использовать только те чат-боты и сервисы, которые одобрены руководством и установлены в контуре вашей организации. Во-вторых, важно помнить — генеративные сети не всегда обладают актуальной информацией и могут быть обучены на устаревших данных, объем их информации ограничен. Даже достоверный и релевантный на первый взгляд результат необходимо перепроверять через независимые источники», — предупредил Сергей Пономаренко.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Google представил VaultGemma — LLM с дифференциальной приватностью

В семействе больших языковых моделей (БЯМ, LLM) с открытым кодом, разработанных в Google, прибавление. Новинка VaultGemma не запоминает конфиденциальные данные при обучении, что предотвращает их слив пользователям.

ИИ-модель, построенная на базе Gemma 2 и работающая по 1 млрд параметров, прошла предварительный тренинг с применением метода дифференциальной приватности (differential privacy) — он добавляет в процесс обучения эталонный шум для ограничения возможности запоминания.

К сожалению, такой подход снижает не только риск утечки конфиденциальных данных, но также точность и быстродействие LLM. Чтобы найти оптимальный баланс между приватностью, практичностью и затратами на вычисления, в Google провели специальное исследование.

Бенчмаркинг показал, что по производительности VaultGemma сравнима с моделями той же величины, но без гарантий конфиденциальности.

 

Подробная информация о новом opensource-проекте, способном ускорить создание приватных и безопасных ИИ-систем для медучреждений, финансовых институтов и госсектора, выложена на Hugging Face и Kaggle.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru