Машинное обучение позволяет обойти ReCAPTCHA

Машинное обучение позволяет обойти ReCAPTCHA

Машинное обучение позволяет обойти ReCAPTCHA

Исследователи из Колумбийского университета разработали автоматическую систему, которая успешно решает большинство каптч, предлагаемых сервисом Google reCAPTCHA. Такие каптчи используют тысячи сайтов, в том числе Google и Facebook.

Речь идёт о преодолении относительно свежей разновидности каптчи, для решения которой нужно выбрать из предложенного списка картинки, удовлетворяющие тому или иному требованию — например, фотографии водоёмов или сосудов с вином.

 

hero-recaptcha-demo

recaptcha

 

Задача решается в два этапа. На первом этапе система получает куки, при помощи которых Google может следить за её поведением, а затем какое-то время ведёт себя максимально человекообразно: посещает различные сайты со случайным интервалом, соблюдает суточный цикл и т.д. Это нужно для того, чтобы Google не заподозрил в ней робота. Роботам он выдаёт более сложные каптчи.

На втором этапе она разбирает каптчу и пытается понять, что изображено на предъявленных картинках. Для этого система использует несколько методов. Во-первых, она обращается к обратному поиску по изображениям в Google Images. Если поисковику известна эта картинка, он сообщает соответствующий текстовый запрос. Во-вторых, система прогоняет её через несколько классификаторов, доступных в виде бесплатных веб-сервисов или библиотек. В-третьих, она проверяет, не знакома ли ей эта картинка. Картинки, которые часто повторяются в разных каптчах, разработчики описали вручную, пишет xakep.ru.

В итоге системе удаётся подобрать текстовые описания для каждой картинки. Трудность заключается в том, что найденные описания далеко не всегда совпадают с подсказкой. Эта проблема решена при помощи ещё одного классификатора, который пытается определить соответствие между словами в описаниях и текстом подсказки.

Систему протестировали на каптчах с сайтов Google и Facebook. Гугловские каптчи удалось обойти в 70,78 процентов случаев. Каптчи с Facebook оказались ещё проще. Система побеждала их в 83,5 процентах случаев. Среднее время решения каптчи составило 19,2 секунды.

Студентку вернули в вуз после отчисления из-за проверки диплома на ИИ

История о борьбе человека и алгоритма получила неожиданную развязку. Верховный суд Татарстана признал незаконным отчисление студентки московского вуза, чей диплом заподозрили в использовании нейросети. Поводом для конфликта стала система проверки текстов на ИИ-контент. Сначала дипломная работа показала результат в 41,91% нейросетевого текста.

Затем студентка доработала и загрузила её повторно. Однако научный руководитель заявила, что в тексте якобы намеренно нарушена логика слов более чем в 70% материала, и сочла это попыткой обмануть проверку.

На третьей проверке показатель внезапно снизился до 11,92%. Казалось бы, вопрос закрыт. Но вуз решил иначе. Работу отказались принимать, сославшись на пропущенный срок сдачи. Хотя последний день подачи приходился на воскресенье, 8 июня 2025 года.

Уже 10 июня кафедра не допустила диплом к защите, а в тот же день был подписан приказ об отчислении. При этом саму студентку на заседание не пригласили и фактически не оставили времени на обжалование решения.

Суд изучил обстоятельства дела и нашёл сразу несколько проблем. Во-первых, была применена статья 193 Гражданского кодекса, согласно которой если последний день срока выпадает на выходной, он переносится на ближайший рабочий день. Значит, диплом был загружен вовремя.

Во-вторых, выяснилось, что отчёт системы проверки носит лишь вероятностный характер и не является окончательным доказательством использования ИИ. Более того, представитель университета признал, что научный руководитель не разбирается в принципах работы системы и самостоятельно не проводил экспертизу текста.

Дополнительный вопрос возник и к самому алгоритму. Представители вуза не смогли объяснить суду, каким образом система отличает обычные заимствования или особенности текста от результатов работы нейросети.

В итоге Верховный суд Татарстана встал на сторону студентки. Её восстановили на четвёртом курсе, обязали вуз допустить диплом к защите при условии оригинальности текста не менее 50%, а также взыскали с учебного заведения 40 тысяч рублей компенсации морального вреда и ещё 20 тысяч рублей штрафа.

RSS: Новости на портале Anti-Malware.ru