Концепт-вирус использует вычислительные мощности графических процессоров

Концепт-вирус использует вычислительные мощности графических процессоров

Ученые из греческого Фонда исследований и технологий в сотрудничестве со специалистами Колумбийского университета разработали концептуальную вредоносную программу, способную задействовать ресурсы графических процессоров (ГП) и обходить тем самым традиционные системы защиты.


Прототип вируса пользуется возможностями графического процессора для расшифровки вредоносного содержимого файла непосредственно перед его запуском. Упаковка объекта - традиционный способ противодействия сигнатурному сканеру: разработчику вредоносной программы достаточно лишь произвести незначительные изменения в алгоритме сжатия или шифрования, чтобы образец перестал детектироваться. До настоящего времени для распаковки всегда задействовался центральный процессор, что ограничивало спектр возможных способов упаковывания.


"Самораспаковка вредоносного кода при помощи ресурсов ГП может существенно затруднить его детектирование и анализ", - отметили ученые в своей исследовательской работе, которая будет представлена на октябрьской Международной конференции IEEE по проблемам вредоносного и нежелательного программного обеспечения. - "Разработчик может воспользоваться мощью современных графических процессоров, архитектура которых позволяет выполнять параллельные вычисления, и зашифровать вредоносную программу при помощи исключительно сложных криптоалгоритмов".


Когда прототип завершает распаковку, код размещается в памяти компьютера и исполняется уже традиционно, центральным процессором. Исследователи подчеркнули, что в подобных вирусах может быть сравнительно мало кода, совместимого с архитектурой Intel x86; по их мнению, это осложнит и анализ таких вредоносных программ, и выпуск антивирусных сигнатур для их детектирования. Впрочем, это не единственная защита от вирусных аналитиков, которая имеется в арсенале концепта: прототип является полиморфом, и соответствующие алгоритмы сокрытия кода он тоже умеет реализовывать при помощи ресурсов графического процессора. "Полностью извлечь исходный код все же возможно, если аналитик будет настойчив и задействует весь доступный ему арсенал средств; однако полиморфизм, подкрепленный возможностями ГП, вынудит исследователя затратить на процедуру реверс-инжиниринга гораздо больше времени и сил, чем обычно", - констатируется в работе.
 
Действительно, в настоящее время графические процессоры становятся все мощнее, а спектр выполняемых ими задач постоянно расширяется. Их способность распараллеливать вычисления прекрасно подходит для некоторых задач - например, для подбора паролей. Хотя прототип предназначен только для ГП, совместимых с архитектурой Nvidia CUDA, потенциальному злоумышленнику будет совершенно не трудно адаптировать его и для графических процессоров AMD.


По мнению исследователей, вскоре наступит время, когда пользующееся ресурсами ГП вредоносное программное обеспечение будет вполне обыденным явлением. Возможно, вскоре мы увидим ботнет-клиенты, использующие возможности графических процессоров для взлома паролей или подбора дешифровочных ключей, вирусы, заставляющие процессор выводить на экран ложную информацию, а также вредоносные образцы, которые вообще не нуждаются в центральном процессоре для своей работы.


The Register

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Языковые модели тупеют от мусорных данных из интернета

Группа исследователей из Университета Техаса и Университета Пердью предложила необычную идею: большие языковые модели (LLM), вроде ChatGPT, могут «тупить» от некачественных данных примерно так же, как люди — от бесконечных часов в соцсетях.

В отчёте специалисты выдвигают «гипотезу гниения мозга LLM». Суть проста: если продолжать дообучать языковую модель на «мусорных» текстах из интернета, она со временем начнёт деградировать — хуже запоминать, терять логику и способность к рассуждению.

Авторы понимают, что отличить хороший контент от плохого сложно. Поэтому они решили изучить 100 миллионов твитов с HuggingFace и отобрать те, что подходят под определение «junk».

В первую группу попали короткие твиты с большим количеством лайков и репостов — те самые, которые вызывают максимальное вовлечение, но несут минимум смысла. Во вторую — посты с «низкой семантической ценностью»: поверхностные темы, кликбейт, громкие заявления, конспирология и прочие «триггерные» темы.

 

Чтобы проверить качество отбора, результаты GPT-4o сверили с оценками трёх аспирантов — совпадение составило 76%.

Учёные обучили четыре разные языковые модели, комбинируя «мусорные» и «качественные» данные в разных пропорциях. Потом прогнали их через тесты:

  • ARC — на логическое рассуждение,
  • RULER — на память и работу с длинным контекстом,
  • HH-RLHF и AdvBench — на этические нормы,
  • TRAIT — на анализ «личностного стиля».

Результаты оказались любопытными: чем больше в обучающем наборе было «интернет-мусора», тем хуже модель справлялась с задачами на рассуждение и память. Однако влияние на «этичность» и «черты личности» было неоднозначным: например, модель Llama-8B с 50% «мусора» даже показала лучшие результаты по «открытости» и «низкой тревожности».

Исследователи сделали вывод: переизбыток интернет-контента может привести к деградации моделей и призвали разработчиков тщательнее отбирать данные для обучения. Особенно сейчас, когда всё больше онлайн-текста создаётся уже самими ИИ — и это может ускорить эффект так называемого model collapse, когда модели начинают обучаться на собственных ошибках.

Учёные шутят: если так пойдёт и дальше, возможно, придётся вернуться к книгам — хотя бы ради того, чтобы «накормить» модели чем-то действительно качественным.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru