GitHub невольно задидосил сайт популярного opensource-проекта GMP

GitHub невольно задидосил сайт популярного opensource-проекта GMP

GitHub невольно задидосил сайт популярного opensource-проекта GMP

Две недели назад скорость серверов gmplib.org резко упала из-за внезапной перегрузки. Как выяснил The Register, DDoS-атаку спровоцировало обновление pull-скрипта клона проекта на GitHub, имеющего более 700 форков.

Библиотека с открытым исходным кодом GNU Multi-Precision (GMP) широко используется различным софтом, в том числе набором компиляторов GCC. Ограничение доступа к такому проекту — большая неприятность, и его участники стали спешно принимать меры по исправлению ситуации.

Было установлено, что тысячи одинаковых запросов исходят с IP-адресов, принадлежащих Microsoft. В имейл-алерте в рамках тематической рассылки на GMP глава проекта Турбьёрн Гранлунд (Torbjörn Granlund) выразил надежду, что нормальный доступ в скором времени удастся восстановить: выявленные источники атаки уже блокируются на файрволе.

На следующий день в той же рассылке появилось сообщение Майка Блэкера (Mike Blacker), директора GitHub по проактивному поиску угроз (threat hunting) и оперативному реагированию. По его словам, совместное расследование GitHub и Microsoft (как владельца) показало, что виновником неумышленной атаки является пользователь, который решил обновить в своей сборке FFmpeg-Builds сценарий, получающий контент с gmplib.org.

Как оказалось, конфигурация этой сборки предполагала параллельный запуск тестов на 100 компьютерах различной архитектуры. Внесенные разработчиком изменения вызвали поток обращений к инфраструктуре GMP, которая, по всей видимости, не была рассчитана на такую нагрузку.

Намек на недостаток мощности обидел Гранлунда: в ответ он заявил, что они используют серверные системы с многоядерными процессорами и большим объемом памяти, а дата-центр, в котором они расположены, хорошо оснащен и использует гигабитный Ethernet.

Тем временем автор FFmpeg-Builds опубликовал коммит, призвав копировщиков его проекта (на GitHub сейчас более 700 клонов) скорректировать рабочие скрипты. Теперь код вначале проверяет репозиторий-источник: если это не оригинал, разработчику высылается эхо-уведомление о необходимости разнесения во времени запланированных cron-задач.

На прошлой неделе, судя по сообщению на сайте GMPLIB от 21 июня, бомбардировка из облака Microsoft все еще продолжалась: изменения, внесенные в одну сборку FFmpeg-Builds, автоматом разбежались по сотням форков. Серверы GMP вернулись в нормальный режим, но лишь благодаря фильтрации по IP на уровне файрвола. В комментарии для The Register Гранлунд уточнил, что они заблокировали около сотни IP-адресов в 40 разных блоках.

OOXML — фикция: LibreOffice обвинила Microsoft в манипуляциях

Проблемы совместимости остаются одной из главных причин, по которым пользователи не спешат переходить с Microsoft Office на LibreOffice. Формально всё работает, но на практике время от времени всплывают странности с вёрсткой, форматированием и отображением данных. И, как считают в The Document Foundation (TDF), дело тут вовсе не в LibreOffice.

Фонд, стоящий за LibreOffice, снова выступил с жёсткой критикой Microsoft. В блоге Итало Виньоли — одного из основателей TDF — корпорация из Редмонда обвиняется в том, что она игнорирует интересы отрасли ради собственных коммерческих целей.

По его словам, утверждение «OOXML — это стандарт, и его просто нужно принять» выглядит, мягко говоря, странно.

Виньоли настаивает: Office Open XML (OOXML) не может считаться полноценным стандартом, пока Microsoft не готова радикально переработать сами приложения Office. В качестве примера он напомнил о давней проблеме Excel с автопреобразованием данных — истории, которая напрямую затронула научное сообщество.

Excel годами автоматически превращал текстовые значения в даты. Для обычных таблиц это удобно, но для генетиков — катастрофа. Названия генов вроде MARCH1, SEPT1 или DEC1 Excel воспринимал как даты и превращал их в «1-Mar», «1-Sep» и «1-Dec».

В 2016 году журнал Genome Biology проанализировал почти 3,6 тысячи научных работ с Excel-файлами и выяснил, что примерно в каждой пятой были ошибки, вызванные именно автозаменой форматов.

Долгое время Microsoft считала проблему нишевой и не давала возможность отключить такое поведение. Лишь в 2023 году компания добавила соответствующую настройку; уже после того, как Комитет по номенклатуре генов человека (HGNC) был вынужден переименовать около 27 генов, чтобы избежать ошибок. К тому моменту ущерб для исследований уже был нанесён.

По словам Виньоли, OOXML «открыт» лишь формально. Спецификация формата занимает около 7 000 страниц, что делает полноценную и корректную реализацию сторонними разработчиками почти невозможной.

Кроме того, Microsoft Office сам не использует строгую версию стандарта (Strict OOXML), предпочитая так называемый Transitional-вариант. В нём до сих пор есть зависимости от старых, проприетарных форматов и поведения древних версий Word — вплоть до элементов с названиями вроде autoSpaceLikeWord95 или shapeLayoutLikeWW8.

Отдельно Виньоли критикует рекомендации использовать Windows Metafile для графики вместо открытых и кросс-платформенных форматов вроде SVG.

Для пользователей всё это выливается в знакомую проблему: документы между Office и LibreOffice открываются, но не всегда так, как ожидалось. Для TDF же это очередное подтверждение того, что формат Office по-прежнему работает как инструмент удержания пользователей внутри экосистемы Microsoft.

Спор вокруг OOXML длится уже много лет, и новый выпад со стороны LibreOffice ясно показывает: вопрос совместимости и «открытых стандартов» по-прежнему далёк от закрытия.

RSS: Новости на портале Anti-Malware.ru