Материал предоставлен http://it.rfet.ru

вопрос по тесту

6 лет назад

Текстовая информация представленная в ряде форматов не индексируются поисковыми машинами. Выберите один или несколько таких форматов. .xls .html .swf .js .png .jpg .doc Я ответила .jng .png - не правильно вариант .js тоже не правильно. Конкретных ответов в интернете не нашла, так как разные поисковые машины могут не индексировать разные файлы. Помогите понять.

6 лет назад

Добрый день, Ирина Викторовна.

Вопрос, на самом-то деле, элементарный. Здесь следует рассуждать.

Вот смотрите. Информация, размещаемая в Интернет, размещается там в формах, которые несут информацию как для человека и так для исполнительных механизмов (назовём это так), лежащих в основе работы всемирной паутины.

Я отдельно выделяю здесь всемирную паутину, чтобы отделить более широкое понятие Интернета от информации, предназначенной для изучения и использования людьми. Эту часть Интернета принято называть всемирной паутиной.

Так вот.

Информация, которая размещается для людей, содержит сведения, которые человек способен и хочет обрабатывать. Обычно индексировать следует сведения, содержащие текстовые данные. Это, как правило, текстовая информация.

Текстовая информация хранится в форматах html, электронных таблицах и т.п.

JS, хоть и является текстовым документом, но предназначен не для человека, а для браузера. Вы совершенно правы в том, что это не может быть общо-индексируемой информацией, потому что это кусок программы.

Аналогично дело обстоит с изображениями. Индексировать там, по-сути, нечего, кроме информации EXIF. Поэтому такие файлы не проходят общую текстовую индексацию.

В итоге, неиндексируемыми являются куски программ и файлы изображений. Всё остальное в этом примере индексируется.

Справедливости ради следует отметить, что сейчас современные поисковые машины позволяют искать по изображениям. Это также можно назвать индексацией с распознаванием. Возможно, немного некорректно поставлен вопрос. Наши редакторы подумают, можно ли улучшить этот тест, чтобы он был более однозначным.

Однако, буквально вопрос звучит так: “текстовая информация в ряде форматов не индексируется некоторыми поисковыми машинами”.

Файл, описывающий векторное иображение в формате swf, также не индексируется, потому что там текстом описаны команды “виртуальному плоттеру”.

Смысл вопроса заключатеся в том, чтобы внести понимание в то, что файлы, хранящие изображение в текстовом виде, не всегда хранят изображение, предназначенное для обработки людьми. Вот такие файлы и не обрабатываются поисковыми машинами и не включаются в общий поисковый индекс.

Хорошего вам дня.

С уважением,
Лахтин Станислав Евгеньевич

Ваш комментарий

Комментирование доступно только для авторизованных пользователей.