И снова СДЭК: в даркнет выложили базу данных транспортной компании

И снова СДЭК: в даркнет выложили базу данных транспортной компании

И снова СДЭК: в даркнет выложили базу данных транспортной компании

Новая порция содержит три файла. В открытый доступ слили минимум 330 тысяч клиентов экспресс-доставки. Дамп одного документа совсем свежий, его сделали 5 июля.

В базе имена, телефоны, почтовые и электронные адреса, треки доставки и пункты самовывоза.

Про очередной слив СДЭКа накануне вечером написал Telegram-канал “Утечки информации”. Свободно скачать можно три файла.

Первый client.csv содержит полную информацию о 330 тыс. клиентов: фамилии получателя, электронки, название компании-отправителя и даже пункт самовывоза.

Второй файл contragent.csv сдаёт контрагентов СДЭКа. 30 тыс. строк с информацией о “физиках” и компаниях на русском и английском языках, телефоны, адреса и треки обновлений. Именно этот файл, судя по датам, был скопирован 5 июля.

Третий документ phone.csv касается телефонов и идентификаторов отправителя / получателя. Данные связаны с первым файлом. После удаления дублей остается почти 25 млн телефонных номеров.

Первая утечка у СДЭКа случилась в феврале. В сеть попали две таблицы с ФИО, телефонами и адресами: один файл содержал 460 млн строк, второй — 820 млн. Оператор подтвердил потерю данных, обвинив хакеров во взломе системы. Клиенты СДЭКа подали на компанию в суд и требуют компенсации. В мае база экспресс-доставки пополнила и карту утечек Яндекс.Еды, ГИБДД, Билайн и Wildberries.

Напомним, Минцифры сейчас дорабатывает законопроект о штрафах за утечки. По первому “сливу” предлагают установить фиксированную ставку, за второй прокол — оборотный штраф. Деньги могут пойти в Фонд, который будет выплачивать компенсации пострадавшим.

Разработка новосибирских ученых снизит галлюцинации ИИ

В Новосибирском государственном университете разработали библиотеку, которая повышает точность и надёжность ответов нейросетей и помогает снизить количество «выдуманных» или заведомо недостоверных ответов — так называемых ИИ-галлюцинаций. Решение получило название RAGU (Retrieval-Augmented Graph Utility) и основано на использовании графов знаний, отражающих связи между различными элементами информации.

Такие графы помогают нейросетям лучше понимать контекст запросов и выявлять неочевидные зависимости. В рамках проекта они были интегрированы с большими языковыми моделями, что позволило повысить качество генерации ответов.

«Саму концепцию придумали не мы. Архитектура GraphRAG была предложена в статье Microsoft, опубликованной около года назад. Идея оказалась удачной, но мы увидели ряд недостатков — в частности, очень долгий процесс построения графа знаний и недетерминированный результат. Наш подход позволил ускорить работу и повысить её надёжность», — рассказал научный сотрудник лаборатории прикладных цифровых технологий Международного научно-образовательного математического центра НГУ Иван Бондаренко.

В отличие от оригинального подхода Microsoft, новосибирские исследователи применили многошаговый метод формирования графа знаний. Это позволило существенно ускорить процесс и снизить требования к вычислительным ресурсам. Если в исходной реализации использовалось порядка 32 млрд параметров, то в RAGU их число удалось сократить почти на два порядка — не только без потери качества, но и с его заметным улучшением.

Помимо специалистов НГУ, в проекте участвовали представители других российских вузов, включая МГУ, Балтийский федеральный университет имени Иммануила Канта, Университет науки и технологий МИСИС, Дальневосточный федеральный университет и Университет ИТМО.

Проект RAGU стал победителем в номинации «Инновации в области искусственного интеллекта» конкурса «Код без границ». Всего в конкурсе приняли участие более 200 проектов.

RSS: Новости на портале Anti-Malware.ru