235 млн профилей пользователей Instagram, TikTok и YouTube утекли в Сеть

235 млн профилей пользователей Instagram, TikTok и YouTube утекли в Сеть

235 млн профилей пользователей Instagram, TikTok и YouTube утекли в Сеть

Команда исследователей из компании Comparitech рассказала об открытой базе данных, раскрывшей около 235 миллионов профилей пользователей Instagram, TikTok и YouTube. Без преувеличения специалисты называют это одной из самых масштабных утечек.

В последнее время эксперты в области кибербезопасности часто указывают на появление всё новых учётных данных на киберпреступных форумах в дарквебе. По последним подсчётам, в «тёмной сети» крутятся 15 миллиардов данных, украденных в 100 тыс. киберинцидентов.

Доходит даже до того, что преступники предлагают скомпрометированные данные бесплатно. Например, группировка Shiny Hunters слила 386 млн утёкших записей, не запросив за них ни копейки.

В этом круговороте украденной информации не последнюю роль играют незащищённые базы данных. Как раз такую базу и обнаружили в августе специалисты Comparitech. В общей сложности исследователи нашли в БД 235 миллионов аккаунтов пользователей Instagram, TikTok и YouTube.

Самый крупных блок данных содержал информацию о профилях Instagram (100 млн), за ним шла коллекция учётных записей TikTok (42 млн), а закрывали тройку профили YouTube (4 млн).

Каждая пятая запись, по словам специалистов, содержала телефонный номер владельца аккаунта и адрес его электронной почты. А каждая строка давала следующие данные:

  • Имя профиля.
  • Полное реальное имя.
  • Фото профиля.
  • Описание аккаунта.

Помимо этого, в базе данных содержалась информация о подписчиках затронутых пользователей.

Проанализировав утечку, эксперты пришли к выводу, что вина лежит на компании Deep Social, которую в 2018 году забанили на площадке Facebook. Причина бана проста — Deep Social не совсем добросовестно собирала данные профилей пользователей.

Разработка новосибирских ученых снизит галлюцинации ИИ

В Новосибирском государственном университете разработали библиотеку, которая повышает точность и надёжность ответов нейросетей и помогает снизить количество «выдуманных» или заведомо недостоверных ответов — так называемых ИИ-галлюцинаций. Решение получило название RAGU (Retrieval-Augmented Graph Utility) и основано на использовании графов знаний, отражающих связи между различными элементами информации.

Такие графы помогают нейросетям лучше понимать контекст запросов и выявлять неочевидные зависимости. В рамках проекта они были интегрированы с большими языковыми моделями, что позволило повысить качество генерации ответов.

«Саму концепцию придумали не мы. Архитектура GraphRAG была предложена в статье Microsoft, опубликованной около года назад. Идея оказалась удачной, но мы увидели ряд недостатков — в частности, очень долгий процесс построения графа знаний и недетерминированный результат. Наш подход позволил ускорить работу и повысить её надёжность», — рассказал научный сотрудник лаборатории прикладных цифровых технологий Международного научно-образовательного математического центра НГУ Иван Бондаренко.

В отличие от оригинального подхода Microsoft, новосибирские исследователи применили многошаговый метод формирования графа знаний. Это позволило существенно ускорить процесс и снизить требования к вычислительным ресурсам. Если в исходной реализации использовалось порядка 32 млрд параметров, то в RAGU их число удалось сократить почти на два порядка — не только без потери качества, но и с его заметным улучшением.

Помимо специалистов НГУ, в проекте участвовали представители других российских вузов, включая МГУ, Балтийский федеральный университет имени Иммануила Канта, Университет науки и технологий МИСИС, Дальневосточный федеральный университет и Университет ИТМО.

Проект RAGU стал победителем в номинации «Инновации в области искусственного интеллекта» конкурса «Код без границ». Всего в конкурсе приняли участие более 200 проектов.

RSS: Новости на портале Anti-Malware.ru