Автор: SatoMaker | Рубрика: Поисковые системы | 30-01-2013 |
В составе современных поисковых систем имеются следующие компоненты:
— программа для скачивания веб-страниц Spider (или паук);
— программа, которая выполняет автоматический переход по всем ссылкам, имеющимся на странице, Crawler (или паук-путешественник);
— программа-индексатор, выполняющая анализ скаченных при помощи «спайдера» веб-страниц;
— база данных, которая является хранилищем скаченной и обработанной информации;
— система, занимающаяся выдачей результатов, их поиском и извлечением из базы данных;
— веб-сервер, осуществляющий взаимодействие пользователя и компонентов поисковой системы.
Разные поисковые системы могут отличаться некоторыми деталями при выполнении поиска, но имеются также и общие черты. Среди них:
— программа-«паук», скачивающая веб-страницы по «браузерному» принципу. Разница в том, что браузер отражает информацию на экране, а Spider нет;
— программа «паук-путешественник» определяет все присутствующие на странице ссылки. Crawler задает «маршрут», по которому дальше будет двигаться «паук», на основании ссылок или заданных адресов, а также занимается поиском новых еще неизвестных поисковикам документов;
— при помощи программы-индексатора страница разбирается на компоненты, которые потом анализируются. Анализу подвергаются следующие элементы: заголовки, тексты, особенности структуры и стиля, специальные html-теги и другие;
— в базу данных заносятся все данные, которые система скачала и проанализировала. Нередко подобное хранилище именуют индексом поисковых систем;
— система, которая выдает результаты, занимается сортировкой страниц. Она отбирает то, что по ее «мнению» подходит под запрос пользователя, и ранжирует найденные страницы, согласно поисковому алгоритму, так если человек задался для себя вопросом — куплю путевку в хороший лагерь, то соответственно поисковик отправляет его на сайты, где он может решить свой вопрос и отдохнуть, к примеру. Данная информация представляет наибольшую ценность, поскольку именно с системой выдачи результатов сотрудничает оптимизатор, стремящийся поднять позиции сайта в поисковиках;
— на веб-сервере имеется html-страница с окошком под ввод нужного для пользователя термина. Этот же сервер выдает результаты под видом html-страниц.
Все факторы, влияющие на позиционирование сайта в поисковиках, условно разделяются на внутренние и внешние. Внутренние факторы контролируются владельцем сайта, то есть текстовая информация, его дизайн и прочие…