Благодаря активным разработкам информационных систем многие организации стали обладателями коллекций информационных ресурсов разной природы, каждая из которых поддерживается собственными программными средствами, обеспечивающими для пользователя свой специфический интерфейс. В таких условиях пользователю было бы желательно иметь единый интерфейс для доступа ко всем этим информационным ресурсам. Поскольку появилось много источников информации, хотелось бы иметь возможность получения более полной и интегрированной информации с использованием нескольких источников. Коллективы, осуществляющие совместную деятельность, стремятся объединить информационные ресурсы, которыми они располагают.
Все эти и другие причины создали предпосылки для проведения исследований и разработок в области интеграции неоднородных информационных ресурсов. Эти исследования приобрели большую актуальность в области информационных систем, особенно в последние годы.
Под интеграцией информационных ресурсов понимается обеспечение пользователям доступа к нескольким источникам информационных ресурсов в терминах единого материализованного или виртуального представления, исключающего избыточность информации на логическом или семантическом уровне.
Неоднородность информационных ресурсов может проявляться в различных аспектах, например:
в различии парадигм моделирования данных (реляционная модель, объектная модель и т.п.);
в многообразии сред представления ресурсов (текстовая, аудио и т.д.);
в разной степени структурированности данных (структурированные, слабоструктурированные, неструктурированные);
в различиях интерпретации их содержания, в различии программных систем, которые их поддерживают, и т.д.
Интеграция информационных ресурсов охватывает большой комплекс проблем, к числу которых относятся, в частности:
разработка интегрирующих моделей данных;
создание методов отображения моделей данных;
создание архитектур систем интеграции;
разработка адаптеров (Wrapper) - компонентов таких архитектур, обеспечивающих интероперабельность интегрируемых неоднородных информационных ресурсов;
создание посредников (Mediator) - компонентов архитектур интеграции, обеспечивающих семантическую интеграцию информационных ресурсов;
интеграция схем объединяемых баз данных;
разработка языков описания онтологии;
создание методов слияния онтологии и др.
Технологии интеграции неоднородных информационных ресурсов уже находят практическое применение. Некоторые относительно простые возможности интеграции обеспечиваются программными продуктами. Более сложные проблемы семантической интеграции пока еще являются предметом изучения многих исследовательских проектов.