Ликбез по подготовке поисковых результатов
Большинство пользователей поисковых систем
ошибочно считает, что после ввода поискового запроса поисковая система
ищет результаты. Правильнее сказать, что поисковая система выдает
заранее найденные и обработанные по определенному алгоритму результаты.
Базы данных популярных поисковых систем
содержат огромный объем информации, который размещается на
сотнях тысяч серверов,
разбросанных по всему миру.
Технически невозможно обработать такой
гигантский объем информации, с последующей выдачей результатов, за
считанный секунды. Результаты поисковых запросов, которые поисковая
система выдает пользователям, подготавливаются заранее.
Упрощенно говоря, для каждого поискового
запроса в поисковой системе заранее подготовлена мини-база. Чем больше
таких заранее подготовленных мини-баз, тем быстрее можно найти
релевантную информацию.
Поэтому число серверов популярных
поисковых систем с каждым годом возрастает.
Чем больше в поисковой системе мини-баз,
тем в меньшей степени общая база данных зависит от выхода из строя одной
или нескольких мини-баз. Тем надежнее поисковая система.
Для обеспечения высокой релевантности
поисковых запросов в алгоритме работы поисковых систем заложено
распределение снижения релевантности не по линейному закону.
 |
Синий цвет - снижение
релевантности по линейному закону.
Зеленый цвет - снижение
релевантности не по линейному закону.
Общий смысл распределения снижения
релевантности поисковых запросов следующий. Количество поисковых
результатов может составлять миллионы. Не менее 95% всех пользователей
ищут информацию не далее чем в 60-70 первых результатах
запросов.
Поиск информации дальше, чем
первые 60-70 запросов, выполняют или Интернет-маркетологи, или
лишь очень дотошные пользователи.
Поэтому можно ограничить общее
количество выдаваемых поисковых результатов до разумного
минимума. Например, до 1000 поисковых результатов.
Алгоритм работы поисковой системы
можно настроить таким образом, чтобы максимально "отсекать"
поисковые результаты с низкой вероятностью релевантности. |
Пример
Поиск информации в библиотеке будет
намного проще и быстрее, если искать нужную информацию не среди книг во
всей библиотеки, а среди ограниченного числа книг. Еще лучше - в одной
книге.
Аналогично, поиск информации в базе данных
поисковой системы будет намного проще, быстрее и дешевле, если искать
нужную информацию не во всей базе данных, а в ограниченном массиве
информации. Еще лучше, если такой массив информации подготовлен заранее. |