Ученые НАСА собрали из Сети 8 млн PDF-файлов для изучения скрытых угроз

Татьяна Никитина 15 Июня 2023 - 14:46

...

Ученые НАСА собрали из Сети 8 млн PDF-файлов для изучения скрытых угроз

В паблик выложена коллекция документов PDF общим объемом около 8 Тбайт, созданная сотрудниками NASA JPL (Jet Propulsion Laboratory). Ресурс можно использовать для поиска вредоносов, спрятанных в файлах, а также багов в реализациях PDF-технологии.

Работы по составлению репрезентативной выборки были проведены совместно с НКО PDF Association в рамках программы SafeDocs, запущенной DARPA. За неполных два года JPL удалось собрать 8 млн файлов и дополнить их метаданными.

Для начала команда изучила каталог публичного репозитория Common Crawl, чтобы выявить PDF, пригодные для включения в коллекцию. В июле и августе 2021 года таким образом было отобрано около 8 млн кандидатов, из которых 2 млн. оказались усеченной копией.

Дело в том, что на Common Crawl действуют ограничения на загрузку: вес файлов не должен превышать 1 Мбайт. Полноценные копии пришлось добывать самостоятельно, используя специальный софт и URL, зафиксированные в репозитории.

Различные метаданные, такие как программа, с помощью которой создавался PDF, извлекались и приобщались к коллекции. Для определения местоположения сервера с сайтом-источником использовалась общедоступная программа геолокации.

Итоговый объем получился впечатляющим — 8 Тбайт. Новая коллекция размещена на серверах AWS, образцы можно скачать в виде ZIP-файлов.

Спецификации PDF замысловаты и объемны (1000 страниц англоязычного текста, содержащего 70 ссылок на другие нормативные документы), и в реализациях нередко встречаются опасные огрехи. Так, открытый юзером PDF-файл с зашифрованными данными можно использовать для эксфильтрации, возможна и подмена содержимого, от которой не спасает даже цифровая подпись. Использование PDF-формата также позволяет надежно скрыть вредоносный код от антивирусных сканеров.

Следующая главная новость »

Кибератака на завод: как избежать простоя и убытков?
Регистрируйтесь на эфир!

Екатерина Быстрова 16 Июня 2026 - 16:11

Windows Уязвимости программ Домашние пользователи Корпорации Microsoft

Одна ссылка в Copilot могла слить почту, содержимое OneDrive и SharePoint

Исследователи из Varonis Threat Labs обнаружили в Microsoft 365 Copilot опасную уязвимость SearchLeak, которая позволяла злоумышленникам похищать корпоративные данные буквально через одну ссылку. Под угрозой оказались электронная почта, заметки встреч, документы OneDrive, файлы SharePoint и другие данные, к которым пользователь имел доступ через Copilot.

Схема атаки выглядела так: злоумышленник отправлял жертве специальную ссылку на Microsoft 365 Copilot Search через почту, Slack или любой другой канал связи.

Внутри ссылки был спрятан вредоносный запрос, который Copilot воспринимал как инструкцию к действию. После открытия такой ссылки ИИ мог получить доступ ко внутренним данным пользователя, найти нужные письма или документы и передать информацию на сервер атакующего.

Особенно неприятен тот факт, что для работы атаки не требовалось скачивать файлы, устанавливать расширения или запускать подозрительные программы. Достаточно было открыть ссылку.

Для обхода защитных механизмов исследователи использовали хитрую комбинацию. Данные выводились через специальный тег изображения, связанный с сервисом поиска по картинкам Bing. Поскольку Bing является доверенным сервисом Microsoft, часть стандартных ограничений безопасности фактически обходилась.

В результате злоумышленники теоретически могли получать темы писем, содержимое сообщений, коды многофакторной аутентификации, ссылки для сброса паролей, данные встреч и конфиденциальные корпоративные документы.

В Microsoft уже закрыли проблему. Уязвимость получила идентификатор CVE-2026-42824, её закрыли на стороне сервиса. Пользователям дополнительно ничего делать не нужно.

Однако исследователи считают, что история гораздо серьёзнее одной конкретной ошибки. По их мнению, SearchLeak демонстрирует целый класс рисков, характерных для корпоративных ИИ-помощников, которые одновременно работают с внешними данными, внутренними документами и способны выполнять действия от имени пользователя.

Кибератака на завод: как избежать простоя и убытков?
Регистрируйтесь на эфир!