Отчет «Cпам в первом полугодии 2008 года» от Лаборатории Касперского

Отчет «Cпам в первом полугодии 2008 года» от Лаборатории Касперского

В первом полугодии 2008 года спам составлял в среднем 85% почтового трафика Рунета. Минимальная доля спама — 64,2% — была зафиксирована 3 мая, максимальная — 97,8% — 1 марта.

В конце весны – начале лета было отмечено сезонное уменьшение доли спама. Летом, как правило, у спамеров меньше заказов, в результате количество спама в почте снижается. Но последние два года спамеры так активно набирали новых клиентов, что даже в летние месяцы количество спама продолжало расти. Характерное для летних месяцев уменьшение доли спама в конце первого полугодия 2008 года может свидетельствовать о насыщении спамерского рынка. Косвенным подтверждением этому служит и уменьшение количества рекламы спамерских услуг: в 2007 году на ее долю приходилось более 7% спама, а в первом полугодии 2008 – 4,3%. При этом новых клиентов спамеры стремятся привлекать за счет качества рассылаемой рекламы – над созданием шаблонов писем работают программисты, маркетологи и дизайнеры.

Пятая часть всех спамовых писем (21%), засоряющих почту Рунета, рассылается из России; 13% – из США, 10% – из Испании; 9% – из Италии; 4% – из Бразилии и столько же – из Франции. Несмотря на обширную «географию» источников спама, в Рунете потоки мусорной почты формируются, в основном, российскими спамерами. Об этом свидетельствует как преобладание спамовых писем на русском языке (79%), так и суточная активность – в соответствии с московским временем – ботнетов, с которых рассылается спам россиянам. При этом лишь 13% таких ботнетов находятся в России.

Большинство спамовых писем (44,4%) – это письма в формате plain text. Он выбирается потому, что в таком формате письмо получается очень легким (1-5 Кб), и, соответственно, большая рассылка будет распространяться быстрее. Треть спамовых писем (31,1%) содержит html-часть, которая позволяет лучше оформить письмо и использовать дополнительные приемы для обхода спам-фильтров. Доля писем с вложенными картинками (jpeg и gif) составляет 23,9%.

В первом полугодии 2008 года спамеры предприняли несколько попыток усовершенствовать старые методы обхода фильтров. Основной упор был сделан на зашумление текста. На этот раз спамеры придумали новые трюки, использующие особенности почтовых клиентов: с помощью html-тэгов они старались сделать так, чтобы письмо, с одной стороны, включало зашумляющий текст, а с другой оставалось «чистым» для пользователя.

Пятерка лидирующих спамерских тематик выглядит вполне традиционно: «Медикаменты; товары и услуги для здоровья» (27,45%); «Образование» (13,86%); «Реплики элитных товаров» (10,68%); «Отдых и путешествия» (8,45%); «Услуги по электронной рекламе» (4,33%). Рубрика «Реплики элитных товаров» (в основном это реклама копий часов Rolex и сотовых телефонов Vertu), появившись в марте, сразу заняла 3-е место и больше не теряла своих позиций. Такой большой процент рубрика набрала за счет писем на русском языке.

Категория «Компьютерное мошенничество» - один из лидеров первого полугодия 2007 - не только покинула первую пятерку, но и стала явным аутсайдером: ее доля составила всего 2,54%. Напомним, что в 2007 году к этой категории относилось 6,9% всего спама, в первом полугодии 2007 года – 8,6%, а в 2006 году – 14,3%. К сожалению, такое снижение вряд ли свидетельствует о том, что интернет стал менее криминализированным. Скорее, можно говорить о целевой направленности мошеннических атак. Происходит активное взаимодействие спамеров с другими представителями киберкриминала – и это взаимодействие делает спам особенно опасным.

Что ожидается в следующем полугодии? Вероятно, спамеры продолжат эксперименты с html-кодом, не исключено, что во второй половине года будут реанимированы некоторые старые методы и трюки обхода защиты. Не вызывает сомнения то, что осенью количество спама в почте возрастет – после сезонного спада спамерской активности обязательно наступит ее подъем.

Полную версию отчета можно прочитать на сайте «Спамтест»: spamtest.ru

На Википедии нашли галлюцинации в ИИ-переводах и ввели ограничения

У Википедии снова случился спор про ИИ, на этот раз из-за переводов. Редакторы ввели новые ограничения для части переводчиков, связанных с Open Knowledge Association (OKA), после того как в ряде ИИ-переводов нашли галлюцинации: подменённые источники, неподтверждённые фразы и даже абзацы, опиравшиеся на материалы, не связанные с темой статьи.

Сама OKA — это швейцарская некоммерческая организация, которая платит стипендии переводчикам и прямо пишет на своём сайте, что использует большие языковые модели, чтобы автоматизировать значительную часть работы.

В англоязычном сегменте Википедии у проекта есть отдельная страница, там сказано, что OKA финансирует переводчиков и работает с несколькими языками, включая русский, испанский, французский и немецкий.

Проблему заметили не «в теории», а на конкретных статьях. Один из редакторов, Ильяс Леблё, рассказал 404 Media, что при выборочной проверке быстро нашёл ошибки: где-то источники были перепутаны, где-то появлялись фразы без верификации, а в одном случае в статью про выборы во французский Сенат попали абзацы, вообще не подтверждавшиеся указанными материалами.

Отдельно редакторов смутило, как именно была организована работа. Публичные инструкции OKA для переводчиков на Meta-Wiki подтверждают, что организация обучает новичков и публикует свои рекомендации открыто. В обсуждении вокруг инцидента также всплывали указания использовать популярные LLM для чернового перевода и правки лидов статей; 404 Media пишет, что раньше в инструкциях фигурировал и Grok, хотя позднее акцент сместили на другие модели.

В итоге Википедия не стала запрещать ИИ-переводы целиком, но решила ужесточить подход именно к переводчикам OKA. По правилам, которые цитирует 404 Media, если такой переводчик за шесть месяцев получает четыре корректно вынесенных предупреждения за непроверяемый контент, то при следующем нарушении его могут заблокировать без дополнительных предупреждений. А материалы, добавленные таким участником, могут удалить, если за них не возьмёт ответственность другой редактор с хорошей репутацией.

У самой OKA своя версия истории. Основатель организации Джонатан Циммерманн заявил, что переводчикам платят почасово, а не за количество статей, и что фиксированной нормы публикаций у них нет. По его словам, организация делает ставку на качество, признаёт, что ошибки случаются, и уже усиливает контроль: вводит второй независимый этап проверки через другую LLM, но не как замену человеку, а как дополнительный фильтр перед ручной верификацией.

RSS: Новости на портале Anti-Malware.ru