Технологии обработки текстов на естественном языке, направленные на извлечение из них той информации, которая была заложена автором.
В системах текстового поиска слово или словосочетание, отражающее какое-либо понятие предметной области текстовой информационной системы и используемое для характеристики смыслового содержания хранимых в системе документов и информационных запросов пользователей
В системах текстового поиска содержательно законченная и уникально идентифицируемая единица информации, представленная на каком-либо естественном языке..
Документ в системе текстового поиска, соответствующий информационной потребности пользователя, которая представлена в поисковом запросе..
Представление электронного документа, позволяющее оперировать элементами его содержания.
Документ, хранимый в памяти компьютера и предназначенный для обработки приложениями и/или для представления пользователю.
Данные, для которых не может быть определена схема, описывающая их структуру и другие свойства. Примерами таких данных являются текстовые документы в системах текстового поиска.
Данные, для которых не может быть определена схема, описывающая их структуру и другие свойства. Примерами таких данных являются текстовые документы в системах текстового поиска.
Вспомогательная структура данных в базах данных, системах текстового поиска, в файловых системах и различных репозиториях, служащая для повышения производительности при выполнении операций поиска информационных ресурсов.
Техника, предназначенная для обеспечения быстрого доступа к данным в базах данных, файлах, хранилищах данных и других репозиториях, которая основана на инверсии значений ключа.
Процесс назначения документу индексирующих его свойств.
Техника, предназначенная для обеспечения быстрого доступа к данным в базах данных, файлах, хранилищах данных и других репозиториях, которая основана на инверсии значений ключа.
Отношение числа выдаваемых системой по запросу релевантных документов к общему числу выданных документов, усредненное по множеству запросов.
Условие, которому должны удовлетворять данные, являющиеся результатом поискового запроса. Глоссарий
Условие принадлежности хранимых в информационной системе документов к множеству документов, релевантных заданному пользовательскому запросу..
Сервер с удаленным доступом в среде web, осуществляющий по запросам клиента поиск релевантных страни.
Явление в документальной информационной системе, когда в результате обработки поисковых запросов выдаются не все релевантные пользовательскому запросу документы, хранимые в системе.
Операция определения местонахождения данных, удовлетворяющих заданному критерию поиска.
Поиск документов, содержащих заданный контекст.
Поиск по критерию, заданному в форме некоторого предиката.
Поиск записей в файлах или в базе данных, кортежей в отношениях и т.д. по заданному значению поискового ключа.
Поиск с использованием содержания полных текстов обрабатываемых документов.
Поиск документов на основе их смыслового содержания и описания семантики информационных потребностей пользователя.
Способность поисковых механизмов информационной системы обеспечивать выдачу всех без исключения хранимых в системе документов, удовлетворяющих критерию, указанному в поисковом запросе.
Структурированное представление содержания документа в системе текстового поиска, используемое в процессе поиска вместо самого документа.
Структурированное представление информационных потребностей пользователя, направляемое информационной системе для выполнения операции поиска требуемых документов..
В системах текстового поиска упорядочение множества документов, выдаваемых пользователю в результате обработки запроса, по убыванию степени релевантности.
Технология оцифровки текстового документа, основанная на использовании сканеров и программ распознавания..
В системах текстового поиска термы, извлеченные из содержания документа, — слова, словосочетания и т.п., какие-либо более сложные конструкции, вычисленные на основе этих извлеченных термов, либо внешние ассоциированные с документом атрибуты, которые идентифицируют данный документ, возможно, не уникальным образом.
Функциональная возможность системы текстового поиска, позволяющая пользователю возвращать системе оценки релевантности выдаваемых по запросу документов.
Мера близости документа пользовательскому запросу, определяемая как значение числовой функции, изменяющейся в интервале [0 .1]
Служебное слово (предлог, союз и т.п.), которое встречается практически в любом документе и тем самым не является информативным. Стоп-слова не могут использоваться в качестве индексирующих свойств документов..
Словарь, описывающий лексические единицы информационного языка, а также смысловые отношения между ними, например отношения синонимии и омонимии..
Ситуация в системе текстового поиска, когда в результате поиска выдаются нерелевантные пользовательскому запросу документы..
Проводившиеся в начале 60-х годов группой К. Клевердона из колледжа по аэронавтике в Крэнфильде (Англия) эксперименты по сравнению средств индексирования документов в системах текстового поиска на основе специально разработанных тестов и методологии..
Набор элементов метаданных, значения которых могут описывать содержание документов различной природы, например книг или публикаций в периодических изданиях, web-документов или HTML-страниц web. Дублинское ядро — стандарт консорциума Dublin Core Metadata Initiative, и ANSI.