Serg-ru

Тест добросовестности и качества детекта

В этой теме 46 сообщений

Добрый день!

Хотим выразить благодарность многим уважаемым участникам этого форума, которые (сами того не зная) помогли нам в нашем небольшом антивирусном тесте - при подготовке, построении методологии, выполнении мы старались воспользоваться теми заниями, которые были нами получены при чтении многих тем этого форума. Мы старились не допускать тех ошибок в тестировании, которые так хорошо объяснены здесь. Поэтому для нас очень важно мнение тех, чьи мысли мы старались учесть.

Не хочется никого обижать, но фамилии многих нам неизвестны, а перечислять всех по никам - кого-нибудь забудем и будет обидно, поэтому назовем тех, чьи фамилии нам известны: Сергей Ильин, Дмитрий Мячин, Василий Бердников, Олег Зайцев, Евгений Касперский, Илья Рабинович, Вячеслав Русаков, Александр Гостев, Валерий Ледовской.

Спасибо им.

Мы провели небольшой (на самом деле на него ушло порядочно времени и сил) тест, а точнее исследование, для которого пришлось потестировать немного, суть которого заключается в выяснении у какой вирусной лаборатории как работают роботы-автоматы для создания большинства детектов - качественно или "по md5 детектим то, что другие".

Полная версия статьи доступна в журнале Хакер 189 (октябрь 2014 года, страница 88 ][-тест) - посмотреть можно в онлайне, скачать с торрента, купить (кому как удобно), сейчас же расскажем суть очень кратко:

1. Была сформирована достаточно репрезентативная вирусная коллекция (около 10 тыс. образцов). Она была on-demand просканирована антивирусами, результаты занесены в таблицу. Сканирование показало практически полное отсутствие мусора и спорных файлов (около недели у нас ушло только на чистку коллекции) - почти у всех известных антивирусов детект был на уровне 98%.

2. Эта же самая коллекция была изменена - в каждом файле сбивался один байт в dos-стабе (в выводимом сообщении о необходимости работы только под DOS) и один байт записывался в оверлей. Эта модифицированная коллекция сканировалась антивирусами и результаты писались в табличку, затем данные сравнивались с данными из первого пункта. Логика: если робот кладет сигнатуры на файлы нормальным способом, то такая "криптовка и обфускация" файлов не даст ощутимого эффекта (снижения уровня детекта), а при шлепании детектов по аналогичному md5-хешу будет заметна разница.

Разница нас шокировала. Мы таких результатов не ожидали, честно. Когда читали сообщения Касперского о том, что некоторые лаборатории так работают мы верили не особо, теперь верим. У многих антивирусов пропал каждый четвертый детект, что красноречиво говорит либо об их уровне технологий массового детектирования, либо о недобросовестной работе (или об их сочетании).

:facepalm:

3. Также была проверена родственная мысль о том, что некоторые антивирусы детектируют все неизвестное, а потом просто убирают ложные срабатывания, которые попадают на известный софт (Java, microsoft), чтобы проходить тесты на ложные срабатывания в известных тестирующих организациях (vb, av-test и т.д).

Логика: берем малоизвестных отраслевой специализированный софт (врачей, инженеров, космонавтов), чистим от адвари и подозрительного ПО (кряки) и проверяем антивирусами. Все детекты антивирусов уложились в десяток файлов, которые уже были тщательно перепроверены, чтобы исключить то, что это не верный детект.

Результаты особо не удивили, примерно так и предполагалось. Но тут не все гладко в тесте - выборка очень маленькая была и софт был только русский, на большом сете подобного софта разных языков картина была бы может иной, но не сильно (на наш взгляд).

Данная статья особо нигде не обсуждалась кроме нашего форума и форума любителей symantec, где это обсуждение в итоге было спрятано от нас в закрытый раздел (им не нравилось то, что у нортона очень высокий процент падения детекта на модифицированном наборе файлов). Мы немного поели собак в деле спора вокруг нашего теста, поэтому попробуем прикрыться на упреждение:

+ Мы не тестировали сигнатурный детект, мы даже места не присуждали за уровень детекта коллекции в первом пункте. Для нас важно было показать у какой вирусной лаборатории насколько честно и правильно работают антивирусные детектировалки - кто-то старается добавлять в базы хитро, а кто-то шлепает на все подряд детект по хешу - для антивирусных тестов сойдет и это.

+ Да, мы знаем, что в антивирусах есть другие защитные модули, но мы их не тестировали. Когда мы будем (условно) тестировать быстродействие, то не надо нам тыкать в самый медленный антивирус и говорить "вы дураки, там зато самый лучший фаервол" - мы фаервол не тестировали, если тестировали производительность, то про нее и пишем. Также и здесь.

+ Давайте общаться мирно. Без оскорблений, обвинений, наездов. Есть критика по методологии/трактовке (по существу) - будем рады услышать и обсудить. А если вся критика в том, что мы идиоты т.к опубликовали исследование в журнале хакер, то просьба проходить мимо темы.

+ на все комментарии, вопросы, уточнения, замечания, критику будем подробно отвечать, если будут нужны дополнительные данные, то можем ими поделиться. Будем рады конструктивному обсуждению.

Почитать online эту статью можно по запросу в google "журнал хакер онлайн" по второй ссылке на сайте с окончанием ua

Или по ссылке

(если ссылка нарушает правила форума, то просьба к модераторам ее затереть)

Во избежание разных казусов ссылку на наш форум, командой которого был проведен тест, мы пока не публикуем, если разрешит администрация, то напишем.

  • Upvote 5

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
1. Была сформирована достаточно репрезентативная вирусная коллекция (около 10 тыс. образцов). Она была on-demand просканирована антивирусами, результаты занесены в таблицу. Сканирование показало практически полное отсутствие мусора и спорных файлов (около недели у нас ушло только на чистку коллекции) - почти у всех известных антивирусов детект был на уровне 98%.

Можно дальше не читать. Уже много много раз обсуждалось, что тесты на коллекциях непонятно чего неактуальны уже лет так 10, что так тестировать нельзя, а тесты такие вредны, так как вводят пользователей в заблуждение.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Если я правильно понял, то суть теста в п.2, а п.1 как база для него. Они просто перепроверили слова Е.К. о фейковых вирлабах. Прикольно :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Можно дальше не читать. Уже много много раз обсуждалось, что тесты на коллекциях непонятно чего неактуальны уже лет так 10, что так тестировать нельзя, а тесты такие вредны, так как вводят пользователей в заблуждение.

Здесь суть именно в выявлении детектов по хешам- кто такими штуками балуется больше, а кто меньше. И результирующая таблица- именно о соотношении первоначально задетектированных семплов к видоизменённым, причём исключительно в смысле хеша, а не функциональности, в различных антивирусных программах. Прикольная идея самого теста, мне нравится, да и результирующая табличка тоже. Респект!

  • Upvote 5

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Ну, скажем так, неплохо для начала, но надо было пойти дальше и проверить на наличие полу-тупых сигнатур. Очевидно, что некоторые не парятся и долбят обычными хэшами, однако, надо понимать, что каждодневный поток просто нереально громадный и совсем неочевидна польза от создания интеллектуальных сигнатур. Особенно при учёте перепаковки. Особенно при учёте, что сигнатуры - отстой :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Ссылка умерла в первом посте :(

Если не обращать внимания на п.1, то тест нужно было позиционировать как "тест качества работы вирлабов". В заголовке же написано в том числе про "качество детекта", а это в данном случае совсем неправильно. Тут ни о каком качестве детекта речь не идет.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Спасибо за внимание к нашему дебютному тесту!

У меня ссылка жива, у парый знакомых тоже, может просто на момент проверки сайт упал.

Сергей Ильин, да, на первый пункт можете не смотреть, просто без него не получился бы следующий этап, а так ведь мы написали, что не тестировали сигнатурный детект. Заголовок может быть можно и другой, но в журнале "Хакер" вообще заголовок еще более плохой.

Если в этом контексте под "качеством детекта" понимать "детектить не по md5 хешу более качественно, чем по нему", то все норм с заголовком - давайте будем считать так.

Очевидно, что некоторые не парятся и долбят обычными хэшами

sww, это вам и Касперскому было очевидно, а нам - нет. Большинству пользователей тоже, потому и перепроверили, теперь это и нам очевидно стало xD а до этого с недоверием смотрели на такие предположения. А что такое полу-тупые сигнатуры?

Здесь суть именно в выявлении детектов по хешам- кто такими штуками балуется больше, а кто меньше.

Краткость - сестра таланта. Суть теста в одном предложении, мы так и думали, но так коротко написать не смогли!

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
мы старались воспользоваться теми заниями, которые были нами получены при чтении многих тем этого форума. Мы старились не допускать тех ошибок в тестировании

Вроде бы для серьёзного портала сообщение писали, а грамотность — на уровне 5-го класса :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

К сожалению, настройки форума не позволяют исправить опечатки в старых сообщениях.

Зайцев Олег тему смотрит, но молчит ;)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
sww, это вам и Касперскому было очевидно, а нам - нет. Большинству пользователей тоже, потому и перепроверили, теперь это и нам очевидно стало xD а до этого с недоверием смотрели на такие предположения. А что такое полу-тупые сигнатуры?

Почти md5, но не md5 :D Для этого надо вообще разобраться с тем как добавляют те или иные вендоры. Учитывать надо много параметров, например, PE/не PE, если PE, то на каком языке написано и так далее.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Зайцев Олег тему смотрит, но молчит ;)

Если оставить в стороне критику, то имхо тест был бы намного показательнее, если бы семплы были бы классифицированы по следующим критериям:

1. По опасности. Логично предположить, что в даже при очень хорошей организации работы вирлаба нет особого смысла тратить ценное время аналитика на то, чтобы накладывать хорошие и качественные сигнатуры на некую мелочь типа адварей (которые не маскируются, да и опасности значимой не несут) и детектить такие файлы "влоб" по хешам типа MD5 всего файла

2. По распространенности зловреда и количеству его разновидностей. Логично, что некую "одноразовую" малварь может задетектить автомат, или детект будет сделан с минимальным участием аналитика. А под зловреда, авторы которого штампуют версию за версией и применяют меры по сбиванию детекта логично сделать хорошие сигнатуры и эвристики

3. особенности исполняемого файла (это то, о чем чуть выше говорил Вячеслав), в простейшем случае например логично различать PE или некий зловредный скрипт/батник, различать упакованные/криптованные PE и неупакованные и так далее.

Вот тогда можно было бы посмотреть на картину в сумме (как сейчас), и по указанным критериям

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Мне кажется, что сообщения от Liv не несут какой-то особой смысловой нагрузки, а преследуют недостижимую цель затроллить Зайцева Олега.

По поводу того, что наш тест можно было сделать более глубоким, путем сортировки вирусов по типам и их актуальности: согласен полностью, но это фактически нереально. Такой тест можно провести только внутри вирусной лаборатории у которой есть общая картина угроз и статистика по их распространенности и тому насколько некая угроза Х распространена, да даже чтобы проследить, что вот этот Trojan.Agent на самом деле родной брат вот этого HEUR нужно хорошо обладать крутой ресурсной базой. У нас же сортировка была намного проще: только PE, никакой адвари и прочего ПНП, потому (как и отметил Зайцев Олег) у нас получилась картина в сумме.

Если же собрать по десятке критериев и отдельно сравнить, то выйдет уточненная картина, например окажется, что у касперского есть хитрые дженерик-детекты, а у xCore уровень падения обнаружения на всех группах одинаков. Это будет показательнее, конечно, но разительно картины не изменит. Очень сомнительно, что последняя тройка вдруг окажется в серединке или в топе. Разумеется, мы согласны, что с научной точки зрения более правильно еще файлы по критериям разбить было, но не потянуть такое. А так, кому интересно и кому было это не так очевидно, сможет для себя убедиться, что детект по хешам существует, причем у кого-то в серьезном ключе, на потоке.

У нас есть несколько вопросов к сообществу:

Читая этот форум, несколько раз встречали мысль о том, что комплексный тест (любой) не потянуть по многим причинам, поэтому дробят - делают нишевые тесты (кто-то тестирует антибаннер, кто-то производительность) - это наглядно показывает что-то одно небольшое (у нас тоже сильно нишевой тест выходит).

Какие можно сделать антивирусные тесты силами небольшой команды?

Крайне желательно иметь дело с вредоносными программами (т.е эргономичность и подобное не предлагайте).

Взять что-нибудь такое небольшое, но что было бы интересно посмотреть многим. А если это будет что-то не совсем обычное (как наш тест), то вообще замечательно. А если после предложения еще поможете (поучавствуете в обсуждении) в разработке методологии, то вообще будет отлично!

Была мысль проверить воровство детектов, но там сложности с выработкой методологии и нормальной доказательной базы.

Отредактировал Serg-ru

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Мне кажется, что сообщения от Liv не несут какой-то особой смысловой нагрузки, а преследуют недостижимую цель затроллить Зайцева Олега.

неа...

Liv - больше известен под ником ВиталеГ, якобы выступает в защиту продукции ESET, против ЛК в целом и отдельных сотрудников в частности, причем использует настолько оригинальные способы что у многих есть серьезные сомнения в том, в чью пользу он высупает

По жизни является каким то специалистом по лифтам

Отличается:

многократной правкой текста

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

По тесту выше уже все хорошо сказано о возможной доработке методологии для пущей наглядности. Но надо понимать, что сам тест достаточно сложен для понимания/обсуждения: "старичкам" итак было ясно существование такой практики, большинство же юзеров просто не сможет понять что же именно вы тестировали, а кто поймет сможет сказать "и че?!" (напомню, что этот аргумент автоматически обламывает все аргументы).

PS: а на форум xCore или Comodo вы не думали сходить копья поломать, ожидая конструктивных сообщений в стиле Олега? :D

Kapral, а в каком томе ЖЗЛ можно ознакомиться с полной биографией Виталега?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
PS: а на форум xCore или Comodo вы не думали сходить копья поломать, ожидая конструктивных сообщений в стиле Олега? :D

Ну, если цель - потроллить фанатиков и если повезёт, то и разработчиков, то можно :lol:

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Kapral, а в каком томе ЖЗЛ можно ознакомиться с полной биографией Виталега?
Появилось предложение поймать его и узнать биографию? ;)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Мне кажется, что сообщения от Liv не несут какой-то особой смысловой нагрузки, а преследуют недостижимую цель затроллить Зайцева Олега.

Никому не кажется, что посты Виталега не несут смысловой нагрузки, на этом форуме их просто игнорируют. Чел настолько неадекватен, что даже не может осознать, что ему здесь не рады.

Какие можно сделать антивирусные тесты силами небольшой команды?

Можно. Только для этого нужно

1. Полная автоматизация всех операций, в том числе- установление факта отсутствия заражения системы и срабатывания защиты (что требует ещё и "затачивания" автоматики под конкретный продукт).

2. Максимальная приближенность тестового стенда к реальной пользовательской конфигурации железа + ПО.

3. Фреймворк для автоматической и одномоментной рассылки и запуска вредоносного семпла (или страницы) на все стенды.

4. Краулер или связи с уже существующими исследовательскими лабораториями на предмет вредоносных семплов и ссылок.

Всё это требует хороших вложений в инфраструктуру тестового комплекса. Ну, или можно заменить автоматику на кучу дешёвых индусов, но тогда резко вырастают расходы на контроль за этими сотрудниками.

Была мысль проверить воровство детектов, но там сложности с выработкой методологии и нормальной доказательной базы.

У вас этот тест не получится без связей в уважаемом вендоре, потому что только он сможет запустить "мульку"- поставить детект на безвредную программу и сделать так, чтобы на детект клюнули без проверки семпла.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Тоже зарегестрировался и хочу поучавствовать в обсуждениях:

1)Хочу сказать, что данный тест независим от какого-либо вирлаба, немногу расскажу его происхождение как всё начиналось:

На форуме (Его не буду называть, дабы не было рекламой), я прочитал предложение "А что будет если у вируса поменять пару байт ?", мне показалось это интересным, мы обдумали методику и начили тестить...

Хотя я изначально относился ко всяким тестам несколько скептически....

2)К сожаление не все АВ смогли протестировать, т.к. даже такой простой тест вызвал много сложностей, расскажу с чем мы сталкнулись:

1.Крах некоторых АВ например в середине теста, очень много вирусов было

2.Крах АВ в момент удаления/лечения вирусни

Очень этим грешила Авира...

Хотели потестить майкрософтсткий защитник виндовз, но он проверял у меня часов где-то пять (Хотя тестовый комп: SSD, процессор: I7), а потом завис... Ну я и нестал дальше его тестить !

В общим просто хочу сказать две вещи:

1. Этот тест не дался нам очень легко и просто, мы много времени на него потратили и сил;

2. Мы не являемся сотрудниками какого-либо вирлаба, мы не являемся сотрудниками журнала "Хакер", статья была размещена по нашей просьбе по email редактору.

PS: а на форум xCore или Comodo вы не думали сходить копья поломать, ожидая конструктивных сообщений в стиле Олега? biggrin.gif

Нет-уж, форума "Любителей Симантек" нам чувствую надолго хватило, пообтикали там маленько, даже не маленько...:)

Модифицировал почти свежий семпл Cidox, куда уже серьёзней угроза, детектирование Касперского пропало, файл работает

Так нужно-было и на Касперском запустить тоже, а то так непонятно, может он при запуске-бы обнаружил...

У каспера по моему мнению не плохой поведенческий детект ! ;)

  • Upvote 5

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

ТС, а можешь дать данные в формате, чтобы я мог копи-паст сделать? Ну и те данные об авторах теста, которые готов раскрыть.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
ТС, а можешь дать данные в формате, чтобы я мог копи-паст сделать? Ну и те данные об авторах теста, которые готов раскрыть.

Вот сама статья в pdf:https://yadi.sk/i/btpiA-MybvyGp

Её можно распространять где угодно, автор там указан и ссылка на журнал тоже...

Так-что с точки зрения морали и закона всё нормально ! ;)

Также залил статью сюда на всякий случай в zip-архив ! :)

Ещё высказывайте своё мнение по тесту даже критику, пожелания, в общем любое конструктивное мнение нам интересно ! ;)

X_____.zip

X_____.zip

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Хочу ещё добавить, вопросы которые у меня возникли и интересно мнение здешних посетителей:

1)На сколько по Вашему мнению тесты подобного рода могут повлиять на покупку определённых АВ, а-то на форуме "КЛК" нас обвинили что якобы из-за этого теста перестанут покупать Нортон, но это-же в корне не верно, по моему мнению !

У нас не было цели кого-то "опутить", или "поднять". Кто читал статью полностью, думаю увидил, что упор делался совсем на другом...

К тому-же не стану скрывать, что некоторые результаты лично меня сильно удивили, например Comodo, Касперский, Доктор Веб меня неприятно удивили, хотя считаю эти продукты достойные, к Нортону всегда относился скептически, но опять-же это моё лично мнение и необязательно с ним соглашаться !

Зато приятно удивил Оутпост, если честно тоже скепрически относился к сканеру, а сейчас считаю что в правильном направлении идут ребята... :)

2)Вопрос уже задавался, но повторю, какие-бы тесты были-бы интересны...

Ведь если посмотреть различные форумы, много тестируют сигнатурный детект, где-то тестят на запуск, где-то тестят на лечение (Это говорю сейчас про любительские тесты), так вот смотрю я эти тесты (результаты) и думаю и что ?

Так-же думают многие, и что ?

Вот-бы сделать какой-нить необычный тест, наподобие этого, да в целом-то многие скажут "А что здесь необычного ?" или тоже "И что ?" !

Думаю будут правы, но какая-то изюминка в этом тесте по моему мнению есть, какая именно:

1.Мы обозначили (доказали) проблему, что некоторые АВ шлепают на все подряд детект по хешу !

2.Что какие-то вирусы в этоге-то можно даже и не "Криптовать", а поменять пару байт, для каких-то АВ и этого достаточно ! :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Искренне полагаю, что любые тесты антивирусов (равно как и систем Internet Security и Total Security) ровным счётом ни насколько не влияют на покупку средств защиты. Причём уже очень давно. Опять-таки, нужно разделять рынки конечного пользователя и бизнес-пользователя. Бизнес-пользователь ваши тесты не воспримет всерьёз, ваша команда в его глазах даже меньше, чем ничто, ну а конечный пользователь... Ну вот насколько влияют на ваше поведение тест, например, минеральной воды? Вы как покупали ту, что пьёте, так и будете продолжать. На решение о покупке средства защиты в таком случае влияют совсем иные факторы, в основном, эмоциональные... :) Сорри, но всё вышеописанное- правда, с которой сам столкнулся.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
Искренне полагаю, что любые тесты антивирусов (равно как и систем Internet Security и Total Security) ровным счётом ни насколько не влияют на покупку средств защиты...

Полностью согласен, но вот пример с водой хочу немножко пообсуждать, ну и спроецировать это к моему вопросу про значение тестов на продажу/использование АВ:

Вот например, если в результате тестов будет доказано что вода вредит здоровью, то ведь многие откажутся покупать такую воду-так ?

Ну и ещё многое зависит от тестирующей организации, если Вася Пупкин провёл тест и сказа "Данная вода вредна", то разумеется все посмеются "Кто такой этот Вася Пупкин ?", а вот если в качестве тестирующей организации будет уважаемая, сертифицированная организация, то-да тогда такой тест уже будет сильно значить для людей...

Так-ли с антивирусами сейчас, или нет ?

Ну и скажу на что я полагаюсь при выборе антивирусов:

1)Можно-ли его настроить, как я хочу;

2)Есть-ли конфликты с нужным мне софтом;

3)Есть-ли Русскоязычная тех. поддержка и интерфейс;

4)Ну и к сожалению личные факторы, гы-гы, а именно продукт должен-быть отечественным раз, что делают его рукаводство и разработчики и как себя ведут себя два, я имею в виду высказывания (Интервью) и прочее...

Поэтому-да, склонен согласится, личные предпочтения ОЧЕНЬ важны... ;)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
1)Можно-ли его настроить, как я хочу;

зачем нужно настраивать антивирус?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Создайте учетную запись или войдите, чтобы комментировать

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!


Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.


Войти с помощью Facebook Войти Войти с помощью Twitter
Anti-Malware.ru Вконтакте   Anti-Malware.ru в Facebook   Anti-Malware.ru в Twitter   Anti-Malware.ru в LinkedIn   RSS