Основные принципы работы поисковых систем

0

Автор: SatoMaker | Рубрика: Поисковые системы | 30-01-2013 |

В составе современных поисковых систем имеются следующие компоненты:

- программа для скачивания веб-страниц Spider (или паук);

- программа, которая выполняет автоматический переход по всем ссылкам, имеющимся на странице, Crawler (или паук-путешественник);

- программа-индексатор, выполняющая анализ скаченных при помощи «спайдера» веб-страниц;

- база данных, которая является хранилищем скаченной и обработанной информации;

- система, занимающаяся выдачей результатов, их поиском и извлечением из базы данных;

- веб-сервер, осуществляющий взаимодействие пользователя и компонентов поисковой системы.

Разные поисковые системы могут отличаться некоторыми деталями при выполнении поиска, но имеются также и общие черты. Среди них:

- программа-«паук», скачивающая веб-страницы по «браузерному» принципу. Разница в том, что браузер отражает информацию на экране, а Spider нет;

- программа «паук-путешественник» определяет все присутствующие на странице ссылки. Crawler задает «маршрут», по которому дальше будет двигаться «паук», на основании ссылок или заданных адресов, а также занимается поиском новых еще неизвестных поисковикам документов;

- при помощи программы-индексатора страница разбирается на компоненты, которые потом анализируются. Анализу подвергаются следующие элементы: заголовки, тексты, особенности структуры и стиля, специальные html-теги и другие;

- в базу данных заносятся все данные, которые система скачала и проанализировала. Нередко подобное хранилище именуют индексом поисковых систем;

- система, которая выдает результаты, занимается сортировкой страниц. Она отбирает то, что по ее «мнению» подходит под запрос пользователя, и ранжирует найденные страницы, согласно поисковому алгоритму, так если человек задался для себя вопросом — куплю путевку в хороший лагерь, то соответственно поисковик отправляет его на сайты, где он может решить свой вопрос и отдохнуть, к примеру. Данная информация представляет наибольшую ценность, поскольку именно с системой выдачи результатов сотрудничает оптимизатор, стремящийся поднять позиции сайта в поисковиках;

- на веб-сервере имеется html-страница с окошком под ввод нужного для пользователя термина. Этот же сервер выдает результаты под видом html-страниц.

Все факторы, влияющие на позиционирование сайта в поисковиках, условно разделяются на внутренние и внешние. Внутренние факторы контролируются владельцем сайта, то есть текстовая информация, его дизайн и прочие.

Записи по данной теме:

Понравилась статья? У Вас есть возможность получать ежедневные обновления блога удобным для Вас способом:
Подписаться на блог 'Сатомейкер' по email

Ваш электронный адрес:

 

 

Подписаться на блог 'Сатомейкер' по email

Подпишитесь через RSS:

 

Добавить в Google

 

Читать в Яндекс.Ленте


Follow Satomaker on Twitter






Ваш отзыв