|
Понимание основных принципов ранжирования
(подготовка и выдача результатов) поисковой системой позволяет понять,
почему включение в состав сайта поискового модуля не только сложная и
дорогостоящая задача, но и, в большинстве случаев, - не дает желаемого
эффекта.
|



|
-
Знание основ работы поисковой системы позволяет избавиться от многих
иллюзий. Важно знать:
-
Ранжирование сайтов поисковой системой
осуществляется на основе алгоритма, который
разрабатывают люди. В любом алгоритме могут быть
ошибки и присутствует субъективность.
-
Для подготовки и
обновления результатов ранжирования сайтов нужно
определенное время.
-
После добавления сайта в базу данных поисковой
системы он появляется в результатах запросов не
сразу, а через некоторое время.
-
После
внесения изменений на сайте информация о них,
выдаваемая поисковой системой, появляется не сразу,
а через некоторое время.
-
С одной стороны,
результаты ранжирования сайтов поисковыми системами тем полнее и точнее, чем
больше в этом процессе присутствует ручного труда.
-
С другой стороны, чем
меньше субъективных критериев используется поисковой системой при
ранжировании сайтов, тем точнее и объективнее результаты.
-
Это противоречие - одна из
проблем создания эффективно работающей поисковой системы.
|

 |
-
Популярные поисковые
системы выдают результаты запросов менее чем за секунду. В результатах
содержатся ссылки на миллионы веб-страниц или сайтов.
-
Объем информации,
проиндексированной популярными поисковыми системами и хранящейся в их
базах данных, составляет от несколько терабайт.
-
Как бы быстро ни работала поисковая система, нельзя быстро выдать
результаты на запрос, если эти результаты заранее не подготовлены.
-
При подготовке результатов на
популярные запросы информация в поисковой системе
разбивается на порции (кластеры).
В каждую порцию информации
включаются заранее проранжированные результаты по одному
или нескольким ключевым словам и производным от них.
На
заметку:
Поиск
информации на персональном компьютере может занять от
нескольких минут до нескольких десятков минут.
Пользователи поисковых систем так долго ждать не будут.
|
 |
-
Разработка систем поиска
по сайту схожа с разработкой поисковой системы Интернета. Основное
отличие - объемы информации.
-
Попытки разработки системы
поиска информации на сайте "на скорую руку" всегда приводят к снижению
эффективности сайта, т.е. к снижению дохода и прибыли от сайта.
-
Низкое качество
результатов, выдаваемых поисковыми модулями, созданными "по-дешевке",
ошеломляют и, порой, приводят в ужас посетителя сайта.
|
Для справки:
Общая схема кластеризации веб-документов
(формирования тематических
групп веб-документов):
-
Очистка
Веб-документы, собранные поисковым роботом, подвергаются предварительно обработке:
-
удаление программного кода;
-
удаление
стоп-слов (шумовых слов);
-
удаление пунктуации;
-
удаление слов, не
имеющих смыслового значения (частицы, междометия и т. д.).
-
Морфологический и синтаксический
разбор
-
приведение слов в начальную форму
(перевод слов в единственное число, удаление суффиксов и т.д.);
-
выделение связанных компонент
(существительное + прилагательное; существительное + глагол и т.д.).
-
Выделение
смыслового ядра каждой веб-страницы и сайта
-
Определение базовых кластеров
-
Группировка базовых кластеров
Суть:
-
Не менее чем для 99% всех
запросов пользователей результаты запросов (ответы на запросы)
подготавливаются заранее.
-
Выдача результатов осуществляется из
выборки базы данных, разделенной на очень большое число
упорядоченных данных.
Пример:
-
1 000 000 заранее
подготовленных результатов запросов поисковой системы может
удовлетворить не менее 99% запросов посетителей.
-
Для каждой
поисковой системы число заранее подготовленных запросов различно и
зависит, в первую очередь, от финансовых возможностей и типа
поисковой системы: глобальная или национальная.
По области
действия поисковые системы можно разделить на глобальные,
которые осуществляют поиск на многих языках без учёта имени домена,
и локальные, которые осуществляют поиск в пределах
определённого домена, например, национального, на определенном
языке.
Важно:
-
При подаче запроса
посетителем поисковая система не выстраивает рейтинг сайтов, а
выдает заранее подготовленный результат.
-
У каждой поисковой
системы уникальный алгоритм. Можно придумать разные алгоритмы
ранжирования сайтов и считать каждый из них самым точным и
объективным.
-
Различие в
алгоритмах работы поисковых систем - основная причина, почему один и
тот же сайт занимает различный рейтинг по ключевому слову в
результатах запросов поисковых систем.
Резюме
-
Разработка эффективной
поисковой системы - сложная и дорогостоящая задача. Не стоит верить
предложениям о разработке за малые деньги эффективного модуля поиска
по сайту.
-
Результаты
ранжирования ключевых запросов модулем поиска по сайту тем полнее и
точнее, чем больше на отладку этих модулей затрачено ручного труда.
-
При поиске
информации в поисковых системах следует учитывать основные
особенности ранжирования сайтов поисковыми системами.
-
Детально разбираться в вопросах ранжирования сайтов поисковыми
системами или ключевых запросов модулем поиска по сайту заказчику
необязательно.
Это -
обязанность веб-студии и веб-дизайнера.
-
Добросовестные
веб-студии или веб-дизайнеры обязаны предупреждать своих заказчиков
об отрицательных последствиях включения в сайт малобюджетных
"готовых" модулей поиска по сайту. Либо информировать заказчиков о реальных сроках и
стоимости разработки полноценных модулей поиска по сайту.
|
|
|