Пиратские ссылки-мутанты обходят блокировки поисковой системы Яндекса

Пиратские ссылки-мутанты обходят блокировки поисковой системы Яндекса

Пиратские ссылки-мутанты обходят блокировки поисковой системы Яндекса

Распространители пиратского контента научились обходить блокировки, введенные поисковиками «Яндекса», Mail.ru Group и Rambler согласно меморандуму, принятому 2,5 года назад. По данным Group-IB, в текущем году в черный список были внесены 6 млн ссылок на пиратский контент; более 1 млн из них по-прежнему доступны в «Яндексе».

Упомянутый меморандум был принят действующими в России поисковиками в 2018 году. Он предполагает создание и ведение реестра источников пиратского контента и удаление соответствующих ссылок из поисковой выдачи в течение нескольких часов.

По словам экспертов, эта мера пресечения противоправной деятельности оказалась эффективной: с момента подписания меморандума «Яндекс» удалил из поисковой выдачи более 15 млн пиратских ссылок, в том числе 6 млн — за три месяца 2021 года. Однако со временем пираты научились отслеживать удаленные ссылки и автоматически генерировать дубли.

Проведенное в Group-IB исследование показало, что из 7309 доменов, внесенных в черный список за истекший период, 3684 все еще можно найти простым поиском. Кроме того, из 6 млн удаленных ссылок на пиратский контент 1 190 039 вернулись в поисковую выдачу.

Как оказалось, для обхода блокировок злоумышленники используют динамические ссылки (например, http://example[.]com/movie_name и http://example[.]com/movie_name_2), замену засветившегося домена другим, более низкого уровня, а также комбинацию обоих методов — исследователи называют такие ссылки «мутирующими». На настоящий момент выявлено 886 411 случаев использования ссылок-мутантов онлайн-кинотеатрами и 303 628 случаев — торрент-трекерами.

«Падение доходов заставляет онлайн-пиратов искать способы заработка, где главным препятствием являлся меморандум, однако он уже не может с прежней эффективностью фильтровать пиратский контент, — отметил Андрей Бусаргин, заместитель гендиректора Group-IB по защите от цифровых рисков. — Новые способы обхода меморандума несут в себе риски для индустрии легального распространения видеоконтента: если существующая версия меморандума будет принята в качестве законопроекта, в нем сохранятся лазейки для пиратского бизнеса, которые могут быть использованы для дальнейшего распространения «пиратки» через поисковую систему «Яндекса».

По данным Group-IB, объем рынка интернет-пиратства в России сократился с $87 млн в 2018 году до $59 млн в 2020 году. Однако в прошлом году количество запросов в поисковиках на просмотр бесплатных фильмов и сериалов увеличилось на 12% и составило 11,8 млрд — по всей видимости, из-за ограничений по ковиду. Основным источником трафика для пиратских онлайн-кинотеатров является поисковик «Яндекс» с долей до 90%.

По мнению экспертов, в борьбе с обходом блокировок нелегального контента могут помочь специализированные фильтры, способные фиксировать количество подозрительных ссылок-дублей, препятствовать попаданию пиратских доменов в поисковую выдачу и замедлять для них индексацию новых страниц. Следует также усовершенствовать алгоритмы поисковых систем — к примеру, ввести ограничение скорости поисковых роботов для сайтов, набравших 100 заблокированных страниц, и удалять их из выдачи, когда этот показатель перевалил за 200. Снизить индекс качества пиратских сайтов (ИКС), влияющий на позицию в результатах поиска, может помочь введение штрафов.

OOXML — фикция: LibreOffice обвинила Microsoft в манипуляциях

Проблемы совместимости остаются одной из главных причин, по которым пользователи не спешат переходить с Microsoft Office на LibreOffice. Формально всё работает, но на практике время от времени всплывают странности с вёрсткой, форматированием и отображением данных. И, как считают в The Document Foundation (TDF), дело тут вовсе не в LibreOffice.

Фонд, стоящий за LibreOffice, снова выступил с жёсткой критикой Microsoft. В блоге Итало Виньоли — одного из основателей TDF — корпорация из Редмонда обвиняется в том, что она игнорирует интересы отрасли ради собственных коммерческих целей.

По его словам, утверждение «OOXML — это стандарт, и его просто нужно принять» выглядит, мягко говоря, странно.

Виньоли настаивает: Office Open XML (OOXML) не может считаться полноценным стандартом, пока Microsoft не готова радикально переработать сами приложения Office. В качестве примера он напомнил о давней проблеме Excel с автопреобразованием данных — истории, которая напрямую затронула научное сообщество.

Excel годами автоматически превращал текстовые значения в даты. Для обычных таблиц это удобно, но для генетиков — катастрофа. Названия генов вроде MARCH1, SEPT1 или DEC1 Excel воспринимал как даты и превращал их в «1-Mar», «1-Sep» и «1-Dec».

В 2016 году журнал Genome Biology проанализировал почти 3,6 тысячи научных работ с Excel-файлами и выяснил, что примерно в каждой пятой были ошибки, вызванные именно автозаменой форматов.

Долгое время Microsoft считала проблему нишевой и не давала возможность отключить такое поведение. Лишь в 2023 году компания добавила соответствующую настройку; уже после того, как Комитет по номенклатуре генов человека (HGNC) был вынужден переименовать около 27 генов, чтобы избежать ошибок. К тому моменту ущерб для исследований уже был нанесён.

По словам Виньоли, OOXML «открыт» лишь формально. Спецификация формата занимает около 7 000 страниц, что делает полноценную и корректную реализацию сторонними разработчиками почти невозможной.

Кроме того, Microsoft Office сам не использует строгую версию стандарта (Strict OOXML), предпочитая так называемый Transitional-вариант. В нём до сих пор есть зависимости от старых, проприетарных форматов и поведения древних версий Word — вплоть до элементов с названиями вроде autoSpaceLikeWord95 или shapeLayoutLikeWW8.

Отдельно Виньоли критикует рекомендации использовать Windows Metafile для графики вместо открытых и кросс-платформенных форматов вроде SVG.

Для пользователей всё это выливается в знакомую проблему: документы между Office и LibreOffice открываются, но не всегда так, как ожидалось. Для TDF же это очередное подтверждение того, что формат Office по-прежнему работает как инструмент удержания пользователей внутри экосистемы Microsoft.

Спор вокруг OOXML длится уже много лет, и новый выпад со стороны LibreOffice ясно показывает: вопрос совместимости и «открытых стандартов» по-прежнему далёк от закрытия.

RSS: Новости на портале Anti-Malware.ru