Алгоритм - система
операций, применяемых по строго определенным правилам, которая после
последовательного выполнения приводит к решению поставленной задачи.
Единой терминологии для
поисковых систем не существует. Нижеприведенная информация и
терминология употреблены исключительно для упрощённого представления об
алгоритме работы поисковой системы.
Работа поисковой системы
циклична. Каждый цикл состоит из
нескольких основных этапов.
1. Поисковая система начинает сбор информации с сайтов. Для
этого она отправляет "программу-паука" (spider),
которая иначе называется "робот" (robot) или "сборщик"
(gather). Указанная программа посещает все сайты,
которые были добавлены в каталог поисковой системы, просматривает их,
запоминает страницы, их названия, рисунки и т.д.

2. Собранная программой-пауком информация поступает в базу
данных поисковой системы.

3. На основе полученной информации
поисковая система проводит индексирование страниц.
-
Смысл индексации
заключается в том, что на основе определённого алгоритма поисковая система
пытается "понять", о чём именно данная страница, что на данной странице
рассказывается, каково её назначение и т.д.
-
Поисковая система выявляет
ключевые слова, т.е. наиболее значимые с её точки зрения слова, на
основе которых строится рейтинг.
-
На основе сравнения различных сайтов и анализа
их ключевых слов строится рейтинг сайтов поисковой системы.
-
Далее полученный рейтинг
сравнивается с предыдущим рейтингом, который был получен при
предыдущем цикле.
-
На основе сравнения
полученного и существующего рейтингов строится результирующий
рейтинг, который будет существовать до проведения следующего цикла.

4. Пользователи, обратившись с запросом к
поисковой системе, получают искомую информацию на основе результирующего
рейтинга.

5. Каждая поисковая система имеет свои
отличия и свою специфику работы. Создать сайт, который будет иметь
одинаковый рейтинг во всех поисковых системах, технически невозможно.
Организовать работу поисковой машины можно двумя способами:
-
Выдача результатов на основе
предварительной обработки результатов (описан выше). Это -
основной способ организации алгоритма работы современных поисковых
машин.
-
Способ прямой
индексации документов без предварительного создания базы данных
(прямой просмотр всех документов). Основной недостаток прямого
просмотра всех материалов - низкая скорость. Основное
преимущество - большая достоверность
результатов, по сравнению с первым способом. При прямом поиске обеспечивается более высокая полнота и точность полученных
результатов.
Резюме
Чем точнее заказчик
сформулирует, какими именно словами можно лаконично охарактеризовать его
бизнес, предлагаемые товары и услуги, тем легче создать сайт, который будет "понятен" поисковым
системам, тем большую отдачу и прибыль может принести создаваемый сайт. |