В рунете под блокировку попали 167 VPN и более 200 имейл-сервисов

В рунете под блокировку попали 167 VPN и более 200 имейл-сервисов

В рунете под блокировку попали 167 VPN и более 200 имейл-сервисов

По словам директора ЦМУ ССОП Сергея Хуторцева, в России с 2021 года было заблокировано 167 VPN-сервисов и свыше 200 почтовых. Эти цифры были озвучены в ходе презентации на форуме «Спектр-2023», проходящем в Сочи.

Кроме VPN и почтовиков, заблокированы 84 приложения. С 2020 года был ограничен доступ к 590 тыс. информационных ресурсов. В этом году удалось добиться блокировки более 2 тыс. фишинговых сайтов и более 20 центров управления и распространения вредоносных программ. Более 17,5 тыс. IP-адресов включены в белый список для фильтров.

«У нас достаточно плотная работа налажена с регуляторами в области информационной безопасности по блокировке вредоносных сайтов, — цитирует ТАСС выступление Хуторцева. — Это и фишинговые ресурсы, и ресурсы, которые участвуют в информационных войнах против РФ, и сервисы обхода блокировок. В настоящий момент мы покрываем практически 100% трафика операторов связи».

Центр мониторинга и управления сетью связи общего пользования (ЦМУ ССОП) был создан на базе подведомственного Роскомнадзору «Главного радиочастотного центра» в рамках реализации закона о суверенном рунете.

«ЦМУ ССОП осуществляет управление и эксплуатацию Автоматизированной системы обеспечения безопасности российского сегмента информационно-телекоммуникационной сети «Интернет», которая включает в себя более 1100 технических средств противодействия угрозам, — отметил, выступая на форуме в Сочи, замглавы Роскомнадзора Олег Терляков. — Они размещены на сетях связи и ограничивают доступ к противоправной информации в интернете. Сейчас обеспечено прохождение трафика свыше 4 тыс. узлов операторов связи через ТСПУ. В среднем одновременно ТСПУ пропускают через себя около 100 Тбит/с трафика».

По закону «О связи» в России запрещена работа сервисов, не обеспечивающих фильтрацию запрещенной информации; предоставление доступа к ней входит в список угроз устойчивости и безопасности рунета.

Согласно регламенту, при блокировке VPN сервис вносится в реестр запрещенных сайтов, который ведет РКН, при снятии ограничений удаляется. Нарушение установленных правил дает оператору сервиса шанс оспорить блокировку.

Усилия регуляторов по повышению безопасности рунета пожелал прокомментировать руководитель группы защиты инфраструктурных ИТ-решений компании «Газинформсервис» Сергей Полунин:

«Борьба с вредоносным программным обеспечением сегодня — это комплексная история, которая требует внимания большого количества участников, причем на самых разных уровнях. Для эффективности сегодня уже недостаточно просто устанавливать антивирусные решения на компьютеры и смартфоны пользователей. Требуется участие регуляторов и поставщиков телекоммуникационных услуг. Именно комплексный подход и координация усилий всех участников процесса позволит со временем минимизировать опасность этой угрозы».

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Языковые модели тупеют от мусорных данных из интернета

Группа исследователей из Университета Техаса и Университета Пердью предложила необычную идею: большие языковые модели (LLM), вроде ChatGPT, могут «тупить» от некачественных данных примерно так же, как люди — от бесконечных часов в соцсетях.

В отчёте специалисты выдвигают «гипотезу гниения мозга LLM». Суть проста: если продолжать дообучать языковую модель на «мусорных» текстах из интернета, она со временем начнёт деградировать — хуже запоминать, терять логику и способность к рассуждению.

Авторы понимают, что отличить хороший контент от плохого сложно. Поэтому они решили изучить 100 миллионов твитов с HuggingFace и отобрать те, что подходят под определение «junk».

В первую группу попали короткие твиты с большим количеством лайков и репостов — те самые, которые вызывают максимальное вовлечение, но несут минимум смысла. Во вторую — посты с «низкой семантической ценностью»: поверхностные темы, кликбейт, громкие заявления, конспирология и прочие «триггерные» темы.

 

Чтобы проверить качество отбора, результаты GPT-4o сверили с оценками трёх аспирантов — совпадение составило 76%.

Учёные обучили четыре разные языковые модели, комбинируя «мусорные» и «качественные» данные в разных пропорциях. Потом прогнали их через тесты:

  • ARC — на логическое рассуждение,
  • RULER — на память и работу с длинным контекстом,
  • HH-RLHF и AdvBench — на этические нормы,
  • TRAIT — на анализ «личностного стиля».

Результаты оказались любопытными: чем больше в обучающем наборе было «интернет-мусора», тем хуже модель справлялась с задачами на рассуждение и память. Однако влияние на «этичность» и «черты личности» было неоднозначным: например, модель Llama-8B с 50% «мусора» даже показала лучшие результаты по «открытости» и «низкой тревожности».

Исследователи сделали вывод: переизбыток интернет-контента может привести к деградации моделей и призвали разработчиков тщательнее отбирать данные для обучения. Особенно сейчас, когда всё больше онлайн-текста создаётся уже самими ИИ — и это может ускорить эффект так называемого model collapse, когда модели начинают обучаться на собственных ошибках.

Учёные шутят: если так пойдёт и дальше, возможно, придётся вернуться к книгам — хотя бы ради того, чтобы «накормить» модели чем-то действительно качественным.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru