Каким образом индексируется разного рода контент

0

Автор: SatoMaker | Рубрика: Для новичков, Заметки, Поисковые системы, Полезное рядом | 26-09-2013 |

index-site

Всем известно, что основа контента большинства сайтов это текст (заметки, статьи, обзоры и т.д.). Текст одинаково хорошо индексируется всеми поисковыми системами, так как именно для анализа такого типа контента и создавались изначально Гугл, Яндекс, Маил.ру и другие поисковики.

Формат, в котором представлен текст в интернете это HTML. То есть непосредственно к тексту добавляются разнообразные теги форматирования (абзац, выделение жирным и подчеркиванием, заголовки различных уровней, списки и т.д.). В результате текст приобретает читабельный и удобоваримый для пользователей вид.

Через какое-то время поисковые системы научились индексировать изображения различных форматов. Самые основные из них это JPG, PNG, GIFF и другие. Необходимость индексации картинок была вызвана новой ступенью развития интернета. Пользователя уже интересовал не только текст, но и графика, а кто-то целенаправленно искал картинки по определенной тематике. Нужно было удовлетворять все эти запросы. Полноценная индексация картинок стала возможной благодаря атрибутам Title и Alt, в которых при помощи текста указывалось содержимое картинки. Сегодня все популярные поисковые системы имеют отдельный поиск по картинкам.

Затем настала эпоха видео. Многочисленные видеоролики буквально заполонили сайты (особенно развлекательной тематики). Кто-то использовал собственный видеоплеер, а кто-то вставлял ролики с популярных видео хостингов. Многие оптимизаторы видят будущее интернета именно за видео контентом, так как он в полной мере может раскрыть ту или иную тему, а также является более наглядным для пользователей. Как же видео индексируется поисковиками? Тут вступают в дело несколько факторов наличие самого видео файла или кода вставки плеера на странице сайта, а также релевантное название этого файла и описание (description). Благодаря наличию этих составляющих поисковик понимает, что это именно видео контент, а также распознает тематику данного видео.

Кроме того, существуют другие типы файлов, которые часто используются на многих сайтах. К примеру, текстовые файлы .doc, файлы Java-скриптов, файлы PDF, которые можно редактировать с помощью nitro pdf professional. Различные поисковики индексируют их по-разному. Как правило, все основные и часто используемые форматы файлов хорошо понимаются поисковыми машинами. Но те же скрипты еще недостаточно изучены поисковиками. В большинстве случаев они не имеют возможности прочитать такие файлы, из-за чего могут возникать различные проблемы с индексацией сложных и функциональных сайтов. Здесь уже в дело вступают модераторы, которые в ручном режиме анализируют подобные сайты и выставляют им соответствующий рейтинг.

Поисковые системы постоянно расширяют число поддерживаемых форматов файлов. Это делается с целью достижения максимальной объективности выдачи и для того, чтобы предоставлять пользователям самый широкий спектр информации. Но веб-мастерам при создании сайта все равно нужно использовать минимальное число форматов (это не обязательная директива, а рекомендация), так как в этом случае поисковику будет намного проще проиндексировать содержимое, да и сделает он это быстрее…

Записи по данной теме:

  • Похожих записей пока что нет :(
Понравилась статья? У Вас есть возможность получать ежедневные обновления блога удобным для Вас способом:
Подписаться на блог 'Сатомейкер' по email

Ваш электронный адрес:

 

 

Подписаться на блог 'Сатомейкер' по email

Подпишитесь через RSS:

 

Добавить в Google

 

Читать в Яндекс.Ленте


Follow Satomaker on Twitter






Ваш отзыв