Учетные провели исследование методов сбора информации спамерами

Учетные провели исследование методов сбора информации спамерами

...

Сотрудники Indiana University Researchers потратили пять месяцев на изучение методик, используемых современными спамерами для формирования и баз данных электронных адресов. Ученые считают, что результаты проведенного исследования окажутся небезынтересными для производителей средств борьбы со спамом.

Нежелательная электронная корреспонденция, или проще говоря спам представляет собой одну из наиболее распространенных и трудноразрешимых проблем, с которой сталкиваются практически все обитатели глобальной сети. По данным аналитиков компании MessageLabs, более 90 процентов писем, ежедневно передаваемых через Интернет, являются спамом.

Исследователи подготовились к эксперименту со впечатляющей основательностью. В качестве наживки были заготовлены 22’230 уникальных адресов электронной почты, которые были «разбросаны» в местах предположительного скопления спамеров.

Достаточно быстро ученым удалось установить, что наиболее привлекательными жертвами для распространителей мусорной корреспонденции являются обитатели Интернет-форумов, указывающие свой электронный адрес в публикуемом сообщении или комментарии. Указание адреса при регистрации на сайте, напротив, представляет собой достаточно безопасную процедуру. В ходе эксперимента ученые зарегистрировались на 70 сайтах и лишь на четыре адреса, указанных в регистрационной форме, начала поступать нежелательная корреспонденция. При этом примерно половина адресов, «засвеченных» в комментариях к постам привлекли к себе внимание распространителей «спама».

Для изучения методик сбора информации с веб-сайтов исследователи использовали специальный сайт, развернутый на собственном домене. Каждому посетителю ресурса демонстрировался уникальный адрес. Таким образом, эксперты смогли приблизительно установить периодичность сканирования сайтов в поисках новых жертв.

Эксперты утверждают, что хакерские приложения, отвечающие за сбор e-mail-адресов, так называемые «краулеры» (crawlers), обладают уникальными характеристиками, которые упрощают их обнаружение. А для того, чтобы отличить вредоносного «краулера» от его законопослушного собрата («онлайновые» поисковые механизмы также используют «ботов» для сбора необходимых данных) достаточно изучить его «место прописки».

Многим пользователям известно, что «краулера» можно без труда ввести в заблуждение путем замены символа «@» в указываемом адресе электронной почты на соответствующий предлог. Результаты проведенных экспериментов подтверждают эффективность этой нехитрой меры предосторожности. Кроме того, ученые доказали, что вероятность попадания пользователя в спамерскую базу данных напрямую зависит от благонадежности посещаемого ресурса.

О результатах своих исследований ученые рассказали на отраслевой конференции Conference on E-mail and Anti-Spam, in Mountain View, проходящей в эти дни в Калифорнии.

источник 

Разработка новосибирских ученых снизит галлюцинации ИИ

В Новосибирском государственном университете разработали библиотеку, которая повышает точность и надёжность ответов нейросетей и помогает снизить количество «выдуманных» или заведомо недостоверных ответов — так называемых ИИ-галлюцинаций. Решение получило название RAGU (Retrieval-Augmented Graph Utility) и основано на использовании графов знаний, отражающих связи между различными элементами информации.

Такие графы помогают нейросетям лучше понимать контекст запросов и выявлять неочевидные зависимости. В рамках проекта они были интегрированы с большими языковыми моделями, что позволило повысить качество генерации ответов.

«Саму концепцию придумали не мы. Архитектура GraphRAG была предложена в статье Microsoft, опубликованной около года назад. Идея оказалась удачной, но мы увидели ряд недостатков — в частности, очень долгий процесс построения графа знаний и недетерминированный результат. Наш подход позволил ускорить работу и повысить её надёжность», — рассказал научный сотрудник лаборатории прикладных цифровых технологий Международного научно-образовательного математического центра НГУ Иван Бондаренко.

В отличие от оригинального подхода Microsoft, новосибирские исследователи применили многошаговый метод формирования графа знаний. Это позволило существенно ускорить процесс и снизить требования к вычислительным ресурсам. Если в исходной реализации использовалось порядка 32 млрд параметров, то в RAGU их число удалось сократить почти на два порядка — не только без потери качества, но и с его заметным улучшением.

Помимо специалистов НГУ, в проекте участвовали представители других российских вузов, включая МГУ, Балтийский федеральный университет имени Иммануила Канта, Университет науки и технологий МИСИС, Дальневосточный федеральный университет и Университет ИТМО.

Проект RAGU стал победителем в номинации «Инновации в области искусственного интеллекта» конкурса «Код без границ». Всего в конкурсе приняли участие более 200 проектов.

RSS: Новости на портале Anti-Malware.ru