Материал предоставлен http://it.rfet.ru

Предварительная обработка запросов поисковой машиной

Возможность свободно формулировать запросы приводит к тому, что потребность в одних и тех же данных пользователи выражают самыми различными способами. Они пишут слова с ошибками, пишут различные падежи, с предлогами и без, не исправляют опечатки, используют синонимы, транслитерацию (написание русских слов латинскими буквами), переставляют слова в запросе, выдумывают несуществующие слова и т. п.


Попробуйте найти разницу в смысле следующих запросов (все формулировки — реальные):

    • военнный комиссариат
    • военный комиасариат
    • военный комиссариар
    • военный комиссарита
    • военный комтссариат
    • военный комиссариат
    • военный косиссариат
    • военныф комиссариат
    • военняй комиссариат
    • военкамат
    • военкомат
    • воинкомат.


А вот еще пример полностью синонимичных запросов:

    • бесплатная отправка смс на билайн
    • бесплатные sms на билайн
    • написать смс бесплатно на билайн
    • отправить бесплатно смс на билайн
    • послать бесплатно смс на билайн
    • beeline sms отправить бесплатно

Как видим, двенадцать разных формулировок в одном случае и шесть в другом на самом деле являются вариациями всего лишь двух запросов. У поисковых машин есть выбор — показывать ссылки на те немногие страницы, где безграмотными авторами упоминается именно «воинкомат», или решить, что пользователю понадобился адрес ближайшего военного комиссариата, и показать ссылки, соответствующие правильному запросу. То же самое и с «(бесплатной/бесплатно) (написать/отправить/послать) (sms/смс) на билайн».


Очевидно, что поисковая машина выбирает вариант «исправления» запроса, ведь ее задача давать пользователю полезную информацию, соответствующую его потребности, а не случайной и неудачной формулировке.

До 2007 года поисковая выдача соответствовала букве запроса. Однако начиная с 2008-го практически все поисковые машины стали пытаться «понять смысл» и подсказывать пользователю правильную формулировку на стадии ввода запроса либо после ввода. А в ряде случаев автоматически исправлять опечатки и выдавать результаты на ошибочный запрос так, словно был введен правильный (см. рисунки ниже).

Автоматическое исправление опечатки в запросе. Исходный запрос «воинкомат». Выдача сформирована как ответ на запрос без опечатки

Подсказки и автоисправления помогают пользователям чаще получать лучшие результаты и значительно снижают время поиска нужной информации.

Для владельца сайта развитие этой функции в поисковиках означает, что теперь нет нужды отдельно заниматься «продвижением» по опечаткам — все равно они будут исправлены.

Подсказки при вводе поискового запроса

Предложение исправить ошибочный вариант запроса на правильный после ввода запроса

Что такое язык запросов?Учет региона, из которого задан поисковый запрос