Материал предоставлен http://it.rfet.ru

Качество поисковой машины

В отношении поисковых машин очень часто можно слышать качественные оценки.
«Я пользуюсь «Яндексом», потому что он лучше ищет!», «Гугл круче всех» — довольно распространенные высказывания.

Что же такое качество поисковика? Обычно синонимом качества поиска считается его релевантность.

Что такое релевантность

В отношении поисковых машин слово релевантный — чуть ли не главный термин. «Релевантная выдача», «релевантные результаты», «у поисковика X релевантность выше, чем у поисковика Y» — такие фразы можно слышать постоянно. Что они означают?

Как уже говорилось выше, релевантный — значит относящийся к делу.

Релевантность результатов поиска поисковой машины означает, что они содержат страницы, относящиеся к делу, то есть к смыслу поискового запроса.

Такое определение релевантности выглядит очень простым. Казалось бы, из него следует, что если мы введем поисковый запрос и если среди первых результатов поиска окажутся только релевантные сайты, то выдача поисковой машины будет релевантна. Однако это не совсем так. Давайте разберемся с этим вопросом подробнее.

Не существует релевантности вообще, в вакууме. Ведь кто-то должен определить, действительно ли сайты соответствуют тому, что предполагалось в запросе. Кто? Очевидно, лучше всего это может сделать сам автор запроса, который ввел его в поисковую машину.

И вот здесь возникает несколько проблем. Ведь не очень интересно обсуждать запросы выдуманные, введенные для эксперимента. В «Яндексе», Mail.ru, Google есть десятки миллионов популярных запросов, которые ежедневно вводят реальные пользователи. А с ними далеко не все так ясно.

Во-первых, большинство запросов — однословные или двухсловные, то есть очень лаконичные. Ясно, что далеко не всегда они полностью отражают смысл искомой страницы. Значит, какие-то условия поиска всегда остаются в уме пользователя недосказанными.

Во-вторых, ни поисковик, ни мы с вами не можем знать, что происходит в уме реального пользователя, вводящего конкретный запрос. Что он на самом деле имел в виду?

В-третьих, у популярных запросов очень много «соавторов» — их вводят совершенно разные люди. Всегда ли они имеют в виду одно и то же — неизвестно. Скорее всего, нет.

Например, что означает запрос дизайн? Что имел в виду автор — веб-дизайн, дизайн квартир, ландшафтный дизайн или промышленный? А что делать, если разные авторы этого запроса имели в виду разное?

Итак, можно сформулировать следующее утверждение: сам по себе поисковый запрос принципиально неполон. Почти всегда существует не высказанное пользователем явно, но важное для него условие релевантности запроса.

Условие релевантности

Условие релевантности — это не входящее в запрос предположение пользователя о том, какие страницы будут релевантным ответом на запрос. Фактически — это скрытая постановка задачи поиска в уме пользователя.

Например, если пользователь вводит запрос «ногу свело», то в большинстве случаев таким условием релевантности является имеющееся в уме пользователя дополнительное ограничение на поиск — «музыкальная группа».

Значит, большинство пользователей поисковика, задавшие запрос ногу свело, имеют в виду именно музыкальную группу и будут довольны, если поисковая машина по запросу ногу свело выведет их прямиком на сайт группы «Ногу свело», на ее последний диск или еще на что-то, связанное с этой музыкальной группой. Заметим, что пользователь, как правило, держит это условие релевантности в уме, не сообщая его поисковику. Почему пользователи так себя ведут — вопрос сложный. Во-первых, они зачастую не осознают того обстоятельства, что запрос может иметь не один смысл. Во-вторых, они экономят силы — если достаточно ввести просто «ногу свело», чтобы «Яндекс» показал сайт группы, зачем трудиться и писать еще что-то? Для большинства популярных запросов такая экономная тактика себя оправдывает.

А тот редкий несчастный пользователь, у которого действительно свело ногу и который хочет узнать в Интернете, что делать в таком случае, по запросу ногу свело вообще не получит никакой информации на первых страницах выдачи. Выдача будет забита ссылками на разные аспекты деятельности группы, и ему придется проявить смекалку и дополнительно уточнять свой «медицинский» запрос. Впрочем, нашему “больному” сможет помочь простая перестановка слов.

Пример

Поисковая выдача запроса “ногу свело”

Поисковая выдача запроса “свело ногу”

Условие релевантности в уме пользователя прямо зависит от его намерений, от цели запроса, от того, что вообще хочет сделать пользователь с найденными по запросу сайтами.

Учет региона, из которого задан поисковый запросЦели и типы поисковых запросов