Содержание
В главе использована книга [KAGA01], c. 130-149.
Значительную долю информационных ресурсов современных информационных систем составляет текстовая информация. Разработкам эффективных технологий хранения, обработки и поиска текстовой информации стало уделяться большое внимание уже на ранних стадиях развития информационных систем. Эта область информационных технологий начала активно развиваться еще в 50-х годах прошлого века, с того времени, когда средства вычислительной техники обеспечили возможность ввода-вывода текстовой информации.
Среди информационных систем, имеющих дело с текстовой информацией, наиболее распространенными являются системы текстового поиска. Их назначение заключается в том, чтобы находить в хранимых в компьютере коллекциях текстовых документов на естественном языке такие документы, которые интересуют пользователей.
Развитие систем текстового поиска стимулировалось в значительной мере разработками автоматизированных библиотечных систем, потребностями информационной поддержки научных исследований и образования. Однако в последние годы они все активнее используются также в управлении компаниями и во многих других сферах деятельности. О востребованности технологий текстового поиска в настоящее время свидетельствуют включение механизмов текстового поиска в целый ряд популярных коммерческих СУБД, а также создание основанных на этих технологиях многочисленных поисовых машин для Всемирной паутины.
Мы обсудим здесь кратко основные понятия и принципы текстового поиска, функциональные возможности предназначенных для этой цели современных информационных систем, а также перспективы их развития.