Ученые научились определять возраст авторов постов в соцсетях

Ученые научились определять возраст авторов постов в соцсетях

Ученые научились определять возраст авторов постов в соцсетях

Интересную разработку реализовали в Курчатовском институте — новая интеллектуальная компьютерная модель может анализировать публикуемые в социальных сетях тексты и определять возраст написавших их лиц.

Если присовокупить это нововведение к разработанной учеными ранее технологии определения пола по тексту — мы движемся к полной деанонимизации в Сети. Более того, на очереди у специалистов метод определения профессии и образования.

К работе над системой привлекли лингвистов, психологов и специалистов по анализу данных. На основе их заключений строилась специальная математическая модель, которая опирается на корреляцию между численными значениями различных параметров текста и характеристик автора.

Для создания этой модели потребовался машинный анализ огромного количества текстов, взятых в Сети, причем необходимым условием было наличие открытого профиля автора текста. Анализировать русскоязычные тексты таким образом стали сравнительно недавно.

«Наша задача — это разработка методики диагностирования возраста участника интернет-коммуникации на основе анализа количественных параметров его текстов», — цитируют «Известия» ведущего научного сотрудника Курчатовского комплекса НБИКС-природоподобных технологий Александра Сбоева.

«Эти исследования идут в рамках гранта Российского научного фонда».

По словам специалистов, эта модель поможет вычислить демографические характеристики автора текста даже в том случае, если он намеренно пытается свой возраст скрыть.

WMX представила систему защиты сайтов от «умных ботов»

Российская компания WMX (ООО «Вебмониторэкс») представила новое решение для защиты веб-ресурсов от автоматизированных атак — WMX SmartBot Protection. Продукт рассчитан не только на массовый бот-трафик, но и на более сложных ботов, которые умеют имитировать поведение обычных пользователей.

Проблема здесь вполне прикладная. Значительная часть интернет-трафика сегодня создаётся не людьми, а автоматизированными скриптами.

Такие боты могут собирать данные с сайтов, перебирать пароли, создавать фейковые аккаунты, искать уязвимости и в целом мешать нормальной работе онлайн-сервисов. Особенно чувствительны к этому интернет-магазины, финансовые сервисы, агрегаторы, доски объявлений, медиаплатформы и стриминговые площадки.

При этом боты становятся всё менее примитивными. Если раньше их можно было сравнительно легко отсечь по шаблонному поведению, то теперь они нередко умеют маскироваться под живого пользователя: заходят через браузер, имитируют движение мыши и даже проходят простые CAPTCHA. Из-за этого стандартных фильтров уже часто недостаточно.

В WMX говорят, что их система использует несколько уровней проверки. Сначала трафик фильтруется по базовым признакам — например, по IP-адресам и User-Agent. Если этого недостаточно, дальше подключается анализ браузерного окружения: параметров экрана, шрифтов, а также особенностей canvas и WebGL, которые могут указывать на эмуляторы или headless-браузеры.

Следующий этап — поведенческий анализ. Система смотрит, как именно ведёт себя пользователь: есть ли движения мыши, насколько быстро заполняются формы и не выглядят ли действия слишком механическими. После этого подключаются эвристики, которые оценивают уже не отдельные признаки, а их сочетание. Например, если кто-то кликает строго по центру кнопок через одинаковые интервалы времени, это может выглядеть подозрительно, даже если по отдельности такие действия не кажутся аномальными.

При необходимости могут использоваться и дополнительные проверки, включая CAPTCHA.

Новое решение работает в связке с WMX ПроWAF, веб-экраном компании. Логика здесь довольно понятная: антибот-система должна отсеивать автоматизированный трафик, а WAF — уже защищать приложение от попыток эксплуатации уязвимостей вроде SQL-инъекций, XSS или RCE. Заодно это снижает нагрузку на инфраструктуру, потому что до основного контура доходит уже более «чистый» трафик.

В компании также сообщили, что в будущих версиях собираются добавить систему скоринга угроз и механизмы, связанные с ML, для автоматического формирования новых эвристик.

RSS: Новости на портале Anti-Malware.ru