Материал предоставлен http://it.rfet.ru

Индексация ссылок

В текстах веб-страниц присутствует множество ссылок на другие страницы Интернета — гипертекстовых ссылок. Для пользователя они выглядят как подчеркнутые или подсвеченные особым цветом слова, по которым можно щелкнуть мышью и перейти на другую страницу. Для поискового робота выделить в тексте страницы гипертекстовые ссылки нетрудно, потому что они всегда имеют формальный вид, начинаясь и заканчиваясь специальными метками языка HTML.

Но ссылки — это не текст, не слова. Нужно ли их индексировать?

Да, безусловно. Индексируя ссылки, поисковики преследуют сразу несколько целей.

  1. Пополнение списка страниц. С помощью ссылок поисковики пополняют свой список веб-страниц для индексации.
  2. Поиск ссылок на заданный сайт. Большинство современных поисковиков позволяют искать по ссылкам на заданный сайт или страницу, как по обычным словам.
  3. Вычисление ранга авторитетности страницы. С помощью ссылок поисковые машины анализируют структуру ссылок сайтов друг на друга, чтобы определить наиболее авторитетные в Интернете страницы и сайты. Правило тут простое: на кого много ссылаются, тот, очевидно, более известен и авторитетен, чем тот, на кого поставили мало ссылок. Авторитетность страницы, вычисленная по количеству ссылок на нее с других страниц, называется ссылочным рангом страницы (по-английски PageRank). Об этом методе ранжирования будет подробно рассказано ниже в данном разделе.
  4. Использование текста ссылки. С помощью текста ссылок можно получить тематическую классификацию страниц. Ведь ссылка обычно содержит в себе не только адрес страницы, но и текст ссылки, то есть те слова, которые подчеркиваются на веб-странице и по которым можно щелкнуть.

    Этот текст поисковики индексируют специальным образом, так как он фактически является кратким смысловым описанием той страницы, на которую ведет ссылка. Это описание можно использовать для поиска веб-страниц (обычно такие страницы помечаются в результатах поиска как «найдено по ссылке»), а также для тематического ранжирования веб-страниц при выдаче результатов поиска.

Об использовании текста ссылок мы подробнее расскажем в разделах «Внутренние факторы, от которых зависит положение сайта в результатах поиска» и «Авторитетность сайта и ссылочное ранжирование».

Какие слова индексирует поисковая машинаГрафический текст