ВКонтакте, Wildberries, СберМаркет раскрыли рекомендательные алгоритмы

ВКонтакте, Wildberries, СберМаркет раскрыли рекомендательные алгоритмы

ВКонтакте, Wildberries, СберМаркет раскрыли рекомендательные алгоритмы

В соответствии с новой нормой российские маркетплейсы, онлайн-кинотеатры, соцсети начали уведомлять пользователей о применении рекомендательных технологий и пояснять, как работает их механизм, какие данные собирает, как их обрабатывает.

Рекомендательные алгоритмы позволяют онлайн-сервису персонализировать список и порядок данных, выдаваемых пользователям в ответ на запрос. Чтобы сделать сервис максимально прозрачным, в Закон об информации были внесены изменения (№ 408-ФЗ от 31.07.2023), вступившие в силу 1 октября.

Поправки вводят новые требования для владельцев сайтов и мобильных приложений с рекомендациями. Они обязаны обеспечить информирование пользователей о применении таких технологий и опубликовать правила применения, со списком собираемых данных, их источников, а также с описанием используемых процессов и методов. Документ должен быть написан на русском языке и доступен без ограничений.

Подобные публикации уже появились на сайтах Wildberries, «CберМаркет», VK, «Иви», START. В основном это встроенные либо всплывающие уведомления-ссылки на домашней странице.

Чтобы узнать предпочтения юзеров, коммерсанты анализируют их поведение на площадке: действия, запросы, длительность сессий. Они также могут собирать такие сведения, как IP-адрес, геолокация, данные устройства, канал взаимодействия, источник перехода на сайт.

За соблюдением новых требований будет следить Роскомнадзор. Обнаружив нарушение, регулятор направит владельцу ресурса уведомление с требованием принять меры. РКН также вправе запросить у нарушителя доступ к программно-техническим средствам ресурса, чтобы провести оценку работы рекомендательного сервиса. Отказ может привести к блокировке.

В Сеть выложили базу с 6,8 млрд адресов электронной почты

На одном из популярных форумов для киберпреступников появился интересный пост: пользователь под ником Adkka72424 заявил, что собрал базу из 6,8 млрд уникальных адресов электронной почты. По его словам, на это ушло несколько месяцев; он выгружал данные из логов инфостилеров, ULP-коллекций и различных баз, циркулирующих в Сети.

Цифра звучит почти фантастически. Однако исследователи Cybernews изучили массив объёмом около 150 ГБ и пришли к несколько иным выводам.

Формально автор не соврал: в файле действительно более 6,8 млрд строк. Но внутри оказалось множество дубликатов и откровенно невалидных адресов. После «очистки» реальное количество рабочих имейлов, по оценке экспертов, может составлять около 3 млрд.

 

Даже если это «всего лишь» 3 млрд, масштаб всё равно впечатляющий. В эпоху автоматизации фишинговых кампаний и атак вида «credential stuffing» объём решает многое. При конверсии всего 0,001% из трёх миллиардов злоумышленники теоретически могут получить около 30 тысяч потенциальных жертв. Для массовых рассылок этого более чем достаточно.

 

Сам автор публикации утверждает, что хотел «повысить осведомлённость» и привлечь внимание эксперта по утечкам Троя Ханта. Параллельно он дал традиционный совет пользователям: сменить пароли и включить двухфакторную аутентификацию. Впрочем, по комментариям на форуме видно, что аудитория интересуется базой прежде всего как инструментом для кросс-проверки других утечек: сопоставляя записи, злоумышленники могут быстрее находить «свежие» скомпрометированные аккаунты и экономить время.

RSS: Новости на портале Anti-Malware.ru