Содержание
В главе использованы электронные материалы Интернет-Университета Информационных Технологий http://www.intuit.ru
За короткий период существования Web объемы информационных ресурсов, доступных в этой глобальной информационной системе, достигли гигантских масштабов. Весьма значительную долю этих ресурсов составляют текстовые документы на различных языках народов мира, представленные в виде HTML-страниц. Поэтому создание доступных пользователям Web средств, реализующих технологии текстового поиска, стало крайне необходимым.
В Интернете размещены миллионы сайтов, причем с актуальной информацией соседствует много устаревших ресурсов, мусора и недобросовестной рекламы.
Интернет - это наиболее демократичный источник информации. Каждый может разместить в Сети собственный ресурс и высказать свое мнение. В этом одновременно сила и слабость Всемирной сети. Плюсы наличия столь демократической площадки очевидны.
Однако отсутствие единоначалия и единых требований по оформлению информации приводит к тому, что в Сети мало кто озабочен тем, чтобы избежать дублирования информации или следовать стандартам, принятым на сайте соседа. И здесь наблюдается резкий контраст с корпоративным документооборотом, описанным ранее.
Находить информацию в Интернете, вероятно, было бы очень трудно, если бы не были созданы мощные поисковые инструменты: поисковые машины (поисковики), каталоги (рубрикаторы), рейтинги, метапоисковые системы и тематические списки ссылок, онлайновые энциклопедии и справочники.
Как показывает практика, для поиска разного рода информации наиболее эффективными оказываются различные инструменты. Рассмотрим каждую категорию по отдельности.