GitHub невольно задидосил сайт популярного opensource-проекта GMP

GitHub невольно задидосил сайт популярного opensource-проекта GMP

GitHub невольно задидосил сайт популярного opensource-проекта GMP

Две недели назад скорость серверов gmplib.org резко упала из-за внезапной перегрузки. Как выяснил The Register, DDoS-атаку спровоцировало обновление pull-скрипта клона проекта на GitHub, имеющего более 700 форков.

Библиотека с открытым исходным кодом GNU Multi-Precision (GMP) широко используется различным софтом, в том числе набором компиляторов GCC. Ограничение доступа к такому проекту — большая неприятность, и его участники стали спешно принимать меры по исправлению ситуации.

Было установлено, что тысячи одинаковых запросов исходят с IP-адресов, принадлежащих Microsoft. В имейл-алерте в рамках тематической рассылки на GMP глава проекта Турбьёрн Гранлунд (Torbjörn Granlund) выразил надежду, что нормальный доступ в скором времени удастся восстановить: выявленные источники атаки уже блокируются на файрволе.

На следующий день в той же рассылке появилось сообщение Майка Блэкера (Mike Blacker), директора GitHub по проактивному поиску угроз (threat hunting) и оперативному реагированию. По его словам, совместное расследование GitHub и Microsoft (как владельца) показало, что виновником неумышленной атаки является пользователь, который решил обновить в своей сборке FFmpeg-Builds сценарий, получающий контент с gmplib.org.

Как оказалось, конфигурация этой сборки предполагала параллельный запуск тестов на 100 компьютерах различной архитектуры. Внесенные разработчиком изменения вызвали поток обращений к инфраструктуре GMP, которая, по всей видимости, не была рассчитана на такую нагрузку.

Намек на недостаток мощности обидел Гранлунда: в ответ он заявил, что они используют серверные системы с многоядерными процессорами и большим объемом памяти, а дата-центр, в котором они расположены, хорошо оснащен и использует гигабитный Ethernet.

Тем временем автор FFmpeg-Builds опубликовал коммит, призвав копировщиков его проекта (на GitHub сейчас более 700 клонов) скорректировать рабочие скрипты. Теперь код вначале проверяет репозиторий-источник: если это не оригинал, разработчику высылается эхо-уведомление о необходимости разнесения во времени запланированных cron-задач.

На прошлой неделе, судя по сообщению на сайте GMPLIB от 21 июня, бомбардировка из облака Microsoft все еще продолжалась: изменения, внесенные в одну сборку FFmpeg-Builds, автоматом разбежались по сотням форков. Серверы GMP вернулись в нормальный режим, но лишь благодаря фильтрации по IP на уровне файрвола. В комментарии для The Register Гранлунд уточнил, что они заблокировали около сотни IP-адресов в 40 разных блоках.

Энтузиаст запустил чат-бот на процессоре Z80 1976 года

Легендарный процессор Zilog Z80, которому в этом году почти 50 лет, внезапно получил собственный «ИИ». Разработчик под ником HarryR представил проект Z80-μLM — крошечную «разговорную модель», которая реально работает на 8-битном Z80 с 64 КБ памяти.

Сразу расставим точки над i: тест Тьюринга этот ИИ не пройдёт, мир не захватит и цены на Z80 из-за него не взлетят. Сам автор честно говорит, что это эксперимент и «развлечение для души». Но эксперимент крайне изящный, именно этим он и цепляет.

Z80-μLM — это минималистичная «разговорная ИИ-модель», которая генерирует ответы посимвольно. Вся система, включая инференс и простой чат-интерфейс, уместилась примерно в 40 КБ. Для наглядности: это обычный .COM-файл, который спокойно запускается в CP/M и помещается в стандартную область памяти TPA.

Внутри сплошная инженерная магия старой школы. Никаких чисел с плавающей точкой, только целочисленная арифметика, заточенная под возможности Z80. Веса квантованы до 2 бит (значения от −2 до +1), четыре веса упакованы в один байт.

Входной текст кодируется через хеширование триграмм в 128 «корзин» — это делает модель устойчивой к опечаткам и нечувствительной к порядку слов. Всё максимально просто, жёстко и эффективно.

HarryR подчёркивает, что его цель была не «ум», а минимальный размер при сохранении ощущения характера. И, как ни странно, это работает. Ответы у чат-бота короткие, иногда нарочито сухие или уклончивые:

  • OK — нейтральное подтверждение,
  • WHY? — сомнение в вашем вопросе,
  • R U? — философский ответ с намёком,
  • MAYBE — честная неопределённость,
  • AM I? — вопрос в ответ.

Из-за этой лаконичности общение превращается в своеобразную игру: приходится угадывать, «понял» ли бот вопрос, и достраивать смысл самому. И тут невольно ловишь себя на мысли, что мозг начинает приписывать этой кучке байтов некую личность. Или это просто классическая человеческая склонность к антропоморфизму — вопрос открытый.

В проекте есть два готовых примера. Первый — Tinychat, простой чат-бот, который отвечает на приветствия и вопросы о себе. Второй — Guess, вариация игры «20 вопросов», где модель загадывает нечто, а пользователь пытается это угадать. Оба варианта доступны в виде готовых бинарников: для CP/M — стандартные .COM-файлы, для ZX Spectrum — .TAP-образы кассет, которые можно загрузить в эмулятор или даже на реальное железо.

Отдельная ирония ситуации в том, что Z80 как раз недавно официально отправили «на пенсию». В апреле 2024 года Zilog объявила о прекращении поддержки чипа (PDF) из-за закрытия производства на стороне фабрики. Правда, почти сразу энтузиасты взялись за замену, и в рамках проекта Tiny Tapeout появился рабочий совместимый клон.

RSS: Новости на портале Anti-Malware.ru