Машинное обучение позволяет обойти ReCAPTCHA

Машинное обучение позволяет обойти ReCAPTCHA

Машинное обучение позволяет обойти ReCAPTCHA

Исследователи из Колумбийского университета разработали автоматическую систему, которая успешно решает большинство каптч, предлагаемых сервисом Google reCAPTCHA. Такие каптчи используют тысячи сайтов, в том числе Google и Facebook.

Речь идёт о преодолении относительно свежей разновидности каптчи, для решения которой нужно выбрать из предложенного списка картинки, удовлетворяющие тому или иному требованию — например, фотографии водоёмов или сосудов с вином.

 

hero-recaptcha-demo

recaptcha

 

Задача решается в два этапа. На первом этапе система получает куки, при помощи которых Google может следить за её поведением, а затем какое-то время ведёт себя максимально человекообразно: посещает различные сайты со случайным интервалом, соблюдает суточный цикл и т.д. Это нужно для того, чтобы Google не заподозрил в ней робота. Роботам он выдаёт более сложные каптчи.

На втором этапе она разбирает каптчу и пытается понять, что изображено на предъявленных картинках. Для этого система использует несколько методов. Во-первых, она обращается к обратному поиску по изображениям в Google Images. Если поисковику известна эта картинка, он сообщает соответствующий текстовый запрос. Во-вторых, система прогоняет её через несколько классификаторов, доступных в виде бесплатных веб-сервисов или библиотек. В-третьих, она проверяет, не знакома ли ей эта картинка. Картинки, которые часто повторяются в разных каптчах, разработчики описали вручную, пишет xakep.ru.

В итоге системе удаётся подобрать текстовые описания для каждой картинки. Трудность заключается в том, что найденные описания далеко не всегда совпадают с подсказкой. Эта проблема решена при помощи ещё одного классификатора, который пытается определить соответствие между словами в описаниях и текстом подсказки.

Систему протестировали на каптчах с сайтов Google и Facebook. Гугловские каптчи удалось обойти в 70,78 процентов случаев. Каптчи с Facebook оказались ещё проще. Система побеждала их в 83,5 процентах случаев. Среднее время решения каптчи составило 19,2 секунды.

Роскомнадзор аннулировал почти 2 тыс. лицензий операторов связи

Роскомнадзор устроил чистку на телеком-рынке: регулятор аннулировал 1967 лицензий операторов связи. Формальная причина — нарушение требований к отчётности. Речь идёт о случаях, когда операторы либо вообще не сдавали обязательные сведения о своей работе, либо передавали неполные или недостоверные данные.

Такие основания действительно предусмотрены законом «О связи». Больше всего аннулированных лицензий, по приведённым данным, пришлось на Москву и Подмосковье.

Дальше идут Санкт-Петербург и Ленинградская область, Краснодарский край, Иркутская и Свердловская области.

Среди компаний, которые сильнее других попали под раздачу, называются «Бридж Телеком», «Озон Телеком», «Информационный центр», «Аффло», «Инфоспектр», «Экосистем», «Ладья», «Медиа-Групп “Регион”» и «Ресурстранзит» — у каждой аннулировали по семь лицензий. Чуть ниже в этом списке — ТЛК и «Синтез Телеком».

И всё это происходит на фоне обсуждения куда более жёсткой реформы. По данным «Известий», Минцифры и участники рынка уже обсуждают новые правила выдачи лицензий на услуги связи.

Среди идей — разделение лицензий на три типа, рост стоимости входа на рынок до 1-50 млн рублей в зависимости от категории, отказ в выдаче лицензий индивидуальным предпринимателям, а также более суровые санкции за повторные грубые нарушения.

Если эти предложения дойдут до реализации, телеком-рынок может стать более агрессивным для небольших и региональных игроков, а нынешнее аннулирование лицензий вполне может оказаться не разовой историей, а частью более широкой тенденции: рынок связи в России постепенно делают более жёстко регулируемым и более дорогим для входа.

RSS: Новости на портале Anti-Malware.ru