Ученые научились определять возраст авторов постов в соцсетях

Ученые научились определять возраст авторов постов в соцсетях

Ученые научились определять возраст авторов постов в соцсетях

Интересную разработку реализовали в Курчатовском институте — новая интеллектуальная компьютерная модель может анализировать публикуемые в социальных сетях тексты и определять возраст написавших их лиц.

Если присовокупить это нововведение к разработанной учеными ранее технологии определения пола по тексту — мы движемся к полной деанонимизации в Сети. Более того, на очереди у специалистов метод определения профессии и образования.

К работе над системой привлекли лингвистов, психологов и специалистов по анализу данных. На основе их заключений строилась специальная математическая модель, которая опирается на корреляцию между численными значениями различных параметров текста и характеристик автора.

Для создания этой модели потребовался машинный анализ огромного количества текстов, взятых в Сети, причем необходимым условием было наличие открытого профиля автора текста. Анализировать русскоязычные тексты таким образом стали сравнительно недавно.

«Наша задача — это разработка методики диагностирования возраста участника интернет-коммуникации на основе анализа количественных параметров его текстов», — цитируют «Известия» ведущего научного сотрудника Курчатовского комплекса НБИКС-природоподобных технологий Александра Сбоева.

«Эти исследования идут в рамках гранта Российского научного фонда».

По словам специалистов, эта модель поможет вычислить демографические характеристики автора текста даже в том случае, если он намеренно пытается свой возраст скрыть.

В дарквебе формируется экономика вокруг продажи устаревших данных из утечек

В теневом интернете сформировалась и продолжает развиваться отдельная экономика, связанная с продажей данных из утечек прошлых лет. Такие массивы по-прежнему приносят прибыль, а анализ подобных угроз для компаний, допустивших компрометацию данных ранее, становится значительно сложнее. К таким выводам пришли исследователи Positive Technologies.

Как выяснилось, злоумышленники успешно продают базы данных, украденные месяцы и даже годы назад.

Монетизации таких массивов, как отмечают исследователи, способствуют громкие заголовки и то, что покупатели далеко не всегда проверяют, действительно ли предлагаемые данные уникальны и недоступны в открытом доступе.

Известны случаи, когда продавцам удавалось сбывать даже те данные, которые уже были опубликованы. Не исключено, что в таких ситуациях покупатели рассчитывают получить более полную версию массива по сравнению с той, что ранее появилась в открытом доступе.

«На рынке всегда найдутся те, кто готов продавать публичные данные под видом эксклюзивных, и те, кто готов их покупать, не проверяя источники», — говорится в обзоре.

В качестве примера в исследовании приведён запрос на базу данных МФО «Займер», датированный 2026 годом. При этом сама компрометация компании произошла ещё в 2024 году. Тогда сообщалось, что в распоряжении злоумышленников могли оказаться данные 16 млн человек.

При этом, как подчёркивают в Positive Technologies, многие сведения из старых утечек по-прежнему сохраняют актуальность. Это касается в том числе паролей и другой чувствительной информации.

На этом рынке возникают и конфликты между самими участниками. Так, в отчёте приводится пример, когда один из пользователей форума опубликовал более сотни сообщений о якобы «новых» утечках. После того как другой продавец указал на несостыковки, первый в ответ выложил в открытый доступ его личную информацию и также обвинил его в продаже уже публичных данных.

RSS: Новости на портале Anti-Malware.ru