Интервью с основателем поискового сервиса Blekko Ричем Скрента

Рич Скрента - один из основателей и руководитель нового сетевого начинания, поисковика Blekko. Одна из базовых его особенностей, заявленных разработчиками и идеологами проекта, состоит в предварительной обработке и очистке результатов поиска; таким образом создатели Blekko надеются победить неблагонадежные сайты и URL-спам. Журналист Интернет-издания V3.co.uk побеседовал с г-ном Скрента относительно особенностей и перспектив строящейся поисковой системы.



- Ваш подход к поиску основан на использовании лист-меток (slashtags). Как работает эта технология?
- Лист-метка - это список сайтов. Допустим, под заголовком "здоровье" составляется список доверенных, надежных ресурсов, посвященных соответствующей тематике; список базируется на отзывах пользователей. В настоящее время у нас имеется уже пара сотен лист-меток, и участники проекта постоянно создают новые - равно как и пополняют старые. В сущности это - классическая wiki-модель. Пользователи вправе редактировать лист-метки - добавлять новые ресурсы, изменять имеющиеся, - и со временем они могут получить приглашение войти в команду редакторов. Участники совместно работают над содержимым, постоянно повышая его качество.


- Ваш индекс не столь велик, как у Google. Сказывается ли это на качестве поиска?
- Действительно, в нашем индексе сейчас имеется только три миллиарда страниц - меньше, чем у Google, - но и этого уже вполне достаточно, если вы четко знаете, что ищете. При этом для повышения качества выдачи мы используем лист-метки: если в результатах поиска много мусора, то его можно без труда отфильтровать и показать посетителю в первую очередь не те сайты, позиции которых основываются исключительно на усилиях SEO-оптимизаторов, а те, которые отмечены сообществом пользователей как надежные и заслуживающие доверия.


- Различные приемы поисковой оптимизации ныне применяются повсеместно. Сильное ли воздействие они способны оказывать?
- Довольно существенное. Необходимо заметить, что в 2000 году алгоритм оценки страниц той же Google действительно был эффективен и полезен: тогда в Сети был миллиард страниц, и по большей части их создавали и поддерживали люди, желавшие помочь и принести пользу другим людям. Теперь, десять лет спустя, в Интернете насчитывается уже более ста миллиардов URL, и значительное количество ресурсов формируется либо людьми, слабо заинтересованными в качестве информации, либо вообще автоматами. Я помню, как служба Hotmail впервые объявила, что 95% всего объема электронной корреспонденции - это спам; что будет, когда 95% Интернет-ресурсов окажутся мусорными? Единственный выход - составить список доверенных источников.


- Насколько серьезна в настоящее время проблема веб-спама?
- Исключительно алгоритмический поиск выводит в выдачу значительные объемы 'серого' спама. Он не столь заметен и очевидно нежелателен, чтобы его блокировали соответствующие фильтры, но и не особенно полезен для посетителя - скорее наоборот. Алгоритм поиска не может отличить, например, статью настоящего квалифицированного врача от публикации полуграмотного компилятора, которому заплатили пару долларов за то, чтобы он соорудил 'нарезку' из нескольких источников, скажем, о диабете. Попробуйте поискать в Сети любую медицинскую информацию, и на первых местах в результатах вашего поиска обязательно окажутся мусорные ресурсы, оттесняющие на задний план действительно полезные сайты.


- Будь я спамером, я бы в первую очередь задумался о фальсификации данных в лист-метках. Предусмотрели ли вы соответствующую защиту?
- Поскольку мы используем wiki-модель, вся пользовательская активность протоколируется. Если мы видим, что кто-то зарегистрировался, добавил один ресурс сомнительного содержания и исчез, то мы уделим такому случаю особое внимание и не пропустим правку без предварительной модерации. Напротив, если кто-то уже не первый месяц (или даже не первый год) пополняет списки тысячами ресурсов безупречного качества, то его мнения и решения будут иметь для нас гораздо больший вес.


- На какой площадке вы размещаете свой проект?
- В нашем распоряжении имеется собственная система из ста серверов, она находится в Саннивейле. При необходимости мы сможем и увеличить вычислительные мощности.


- Будете ли вы предоставлять дополнительные службы - например, что-то вроде Google Apps?
- На данный момент проект Blekko - это 22 человека, которые занимаются сооружением поискового сервиса. В такой ситуации говорить о расширении функционала несколько преждевременно. Мы полностью сосредоточились на поисковике, и других планов у нас пока нет.


- А есть ли у вас планы извлечения прибыли от проекта?
- Пока у нас на сайте нет никакой рекламы. Сейчас главное - это сформировать аудиторию. Но реклама посредством поисковых служб - уже установившийся бизнес, а наша цель - предлагать пользователям, ищущим нужные им сведения, наиболее ценные и полезные результаты поиска.


- Вы говорили, что не собираетесь бороться с Google за место на рынке. В чем состоят ваши цели?
- Нам бы хотелось, чтобы посетители действительно извлекали пользу из работы с ресурсом. Как и любой новый поисковик, мы сейчас привлекаем много внимания, однако наше намерение - не только привлечь, но и удержать пользователей, чтобы они не только получили нужные им результаты сегодня, но и пришли за новой информацией завтра. У нас есть ряд новых функциональных возможностей, релевантные данные по множеству тем и постоянно расширяющийся (благодаря активной работе участников проекта) набор категорий. Я уверен: эта модель сработает.

V3.co.uk побеседовал с г-ном Скрента относительно особенностей и перспектив строящейся поисковой системы.

" />

Anti-Malware Яндекс ДзенПодписывайтесь на канал "Anti-Malware" в Яндекс Дзен, чтобы первыми узнавать о новостях и наших эксклюзивных материалах по информационной безопасности.

BI.ZONE подвергся рекордной DDoS-атаке с пиком в 1,3 Tб/с

BI.ZONE подвергся DDoS-атаке полосой в 1,3 Тб/с. Рекорд “поймал” партнер вендора — компания Qrator Labs. Сеть отфильтровала весь нелегитимный трафик, инфраструктура BI.ZONE и его клиентов продолжила работу без сбоев.

DDoS-атака типа UDP flood на BI.ZONE была организована 28 января, сообщили в MSSP-провайдере Qrator Labs. Компания специализируется на обеспечении доступности интернет-ресурсов и нейтрализации DDoS-атак.

Во время такой атаки сервер-жертва получает огромное количество UDP-пакетов большого объема от широкого диапазона IP-адресов. Это провоцирует перегрузку сетевых интерфейсов, так как вся полоса пропускания занята поддельными UDP-пакетами.

Сообщается, что сеть Qrator Labs успешно отфильтровала нелегитимный трафик, и инфраструктура BI.ZONE продолжала функционировать в обычном режиме, без простоев в работе сервиса.

“Беспрецедентный рост количества, интенсивности и скоростей DDoS-атак, начавшийся год назад, не сбавляет своих позиций”, — комментирует новость основатель Qrator Labs Александр Лямин.

По его словам, сегодня фиксируются уже не атаки базового уровня, а массированные нападения, затрагивающие сети даже крупных провайдеров. Это подтверждает факт атаки, организованной на инфраструктуру BI.ZONE.

“DDoS-атака полосой в 1,3 Тб/с — это новый рекорд для российского сегмента интернета”, — подчеркивает Лямин.

Такие атаки очень разрушительны по своей природе и в случае успеха могут создавать колоссальные проблемы для бизнеса жертвы.

В этот раз атака на сеть BI.ZONE не достигла цели: Qrator Labs справилась с объемом нелегитимного трафика за счет распределенной инфраструктуры, базирующейся на 15 центрах очистки трафика по всему миру.

Компания смогла сохранить работоспособность сервисов, несмотря на пиковые нагрузки во время атаки.

“Наша облачная инфраструктура постоянно подвергается DDoS-атакам, поэтому мы вынуждены выстраивать эшелонированную защиту как на канальном, так и на прикладном уровне, — говорит директор по продуктам и технологиям BI.ZONE Муслим Меджлумов. — В этот раз злоумышленники запускали серию коротких атак на протяжении нескольких дней. Пик пришелся на один из наших эшелонов, построенных в партнерстве с Qrator Labs”.

Добавим, в клиентах BI.ZONE почти 80% российского финрынка. Среди них — Ассоциация Банков России, Сбер, Home Credit Bank, Банк Санкт-Петербург и другие.

Раньше атаки на полосу пропускания, как правило, создавались с использованием различных техник усиления (amplification), обращает внимание Меджлумов. Сейчас же в основном используются сети из зараженных устройств интернета вещей. Они генерируют мультитерабитный поток без подмены IP-адресов источников, где несколько тысяч хостов могут создавать угрозы национального масштаба.

Добавим, последние “тренды” в DDoS лучшие отечественные ИБ-эксперты обсуждали на январском эфире AM Live DDoS:переосмысление опыта и рекомендации на 2023 год, обзор выпуска — в материале AM Live: Хактивисты и DDoS подталкивают интернет к его милитаризации.

Мировой рекорд по мощности DDoS-атак был поставлен в октябре прошлого года. Киберпреступники атаковали Wynncraft, один из крупнейших серверов Minecraft. Специалисты Cloudflare зафиксировали DDoS-атаку мощностью до 2,5 Тб/с. Тогда серьезных последствий удалось избежать.

На втором месте мирового “DDoS-рейтинга” команда AWS Shield и атака мощностью 2,3 Тб/с. В отчете Amazon говорится, что с угрозой боролись три дня.

В российском сегменте предыдущий рекорд случился также в 2022 году, мощность DDoS-атаки достигала 760 Гб/с. А самая долгая атака продолжалась 3 месяца или 2 тыс. часов.

Anti-Malware Яндекс ДзенПодписывайтесь на канал "Anti-Malware" в Яндекс Дзен, чтобы первыми узнавать о новостях и наших эксклюзивных материалах по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru