17.1.  Понятие информационной базы и способы ее организации

Основной частью внутримашинного информационного обеспечения является информационная база. Информационная база (ИБ) ─ это определенным способом организованная совокупность данных, хранимых в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информационные потребности управленческих процессов и решаемых задач.

Файл ─ это некоторое множество записей однородной структуры, предназначенное для решения экономических задач. Запись ─ это набор полей определенного формата, объединенных по общему ключевому полю. Все файлы ЭИС можно классифицировать по следующим признакам:

∙  по этапам обработки (входные, базовые, результатные);

∙  по типу носителя (на промежуточных носителях ─ гибких магнитных дисках и магнитных лентах, и на основных носителях ─ жестких магнитных дисках, магнитооптических дисках и др.);

∙  по составу информации (файлы с оперативной информацией и файлы с постоянной информацией);

∙  по назначению (по типу функциональных подсистем);

∙  по типу логической организации (файлы с линейной и иерархической структурой записи);

∙  по способу физической организации (файлы с последовательным, индексным и прямым способом доступа).

Входные файлы создаются с первичных документов для ввода данных или обновления базовых файлов.

Файлы с результатной информацией предназначаются для вывода ее на печать или передачи по каналам связи и не подлежат долговременному хранению.

К числу базовых файлов, хранящиеся в информационной базе, относят основные, рабочие, промежуточные, служебные и архивные файлы.

Основные файлы должны иметь однородную структуру записей и могут содержать записи с оперативной и условно-постоянной информацией. Оперативные файлы могут создаваться на базе одного или нескольких входных файлов и отражать информацию одного или нескольких первичных документов. Файлы с условно-постоянной информацией могут содержать справочную, расценочную, табличную и другие виды информации, изменяющейся в течение года не более чем на 40 %, а, следовательно, имеющие коэффициент стабильности (Кст) не менее 0,6.

Файлы со справочной информацией должны отражать все характеристики элементов материального производства (материалы, сырье, основные фонды, трудовые ресурсы и т.п.). Как правило, справочники содержат информацию классификаторов и дополнительные сведения об элементах материальной сферы, например о ценах. Нормативно-расценочные файлы должны содержать данные о нормах расхода и расценках на выполнение операций и услуг. Табличные файлы содержат сведения об экономических показателях, считающихся постоянными в течение длительного времени (например, процент удержаний, отчислений и пр.). Плановые файлы содержат плановые показатели, хранящиеся весь плановый период.

Рабочие файлы создаются для решения конкретных задач на базе основных файлов путем выборки части информации из нескольких основных файлов с целью сокращения времени обработки данных.

Промежуточные файлы отличаются от рабочих файлов тем, что они образуются в результате решения экономических задач, подвергаются хранению с целью дальнейшего использования для решения других задач. Эти файлы, также как и рабочие файлы, при высокой частоте обращений могут быть также переведены в категорию основных файлов.

Служебные файлы предназначаются для ускорения поиска информации в основных файлах и включают в себя справочники, индексные файлы и каталоги.

Архивные файлы содержат ретроспективные данные из основных файлов, которые используются для решения аналитических, например, прогнозных задач. Архивные данные могут также использоваться для восстановления информационной базы при разрушениях.

Организация хранения файлов в информационной базе должна отвечать следующим требованиям:

∙  полнота хранимой информации для выполнения всех функций управления и решения экономических задач;

∙  целостность хранимой информации, т.е. обеспечение непротиворечивости данных при вводе информации в ИБ;

∙  своевременность и одновременность обновления данных во всех копиях данных;

∙  гибкость системы, т.е. адаптируемость ИБ к изменяющимся информационным потребностям;

∙  реализуемость системы, обеспечивающая требуемую степень сложности структуры ИБ;

∙  релевантность ИБ, под которой подразумевается способность системы осуществлять поиск и выдавать информацию, точно соответствующую запросам пользователей;

∙  удобство языкового интерфейса, позволяющее быстро формулировать запрос к ИБ;

∙  разграничение прав доступа, т.е. определение для каждого пользователя доступных типов записей, полей, файлов и видов операций над ними.

Существуют следующие способы организации ИБ: совокупность локальных файлов, поддерживаемых функциональными пакетами прикладных программ, и интегрированная база данных, основывающейся на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных, то есть системы управления базами данных (СУБД).

Локальные файлы вследствие специализации структуры данных под задачи обеспечивают, как правило, более быстрое время обработки данных. Однако недостатки организации локальных файлов, связанные с большим дублированием данных в информационной системе и, как следствие, несогласованностью данных в разных приложениях, а также негибкостью доступа к информации, перекрывают указанные преимущества. Поэтому организация локальных файлов может применяться только в специализированных приложениях, требующих очень высокую скорость реакции, при импорте необходимых данных их интегрированной ИБ.

Интегрированная ИБ, т.е. база данных (БД) ─ это совокупность взаимосвязанных, хранящихся вместе данных при такой минимальной избыточности, которая допускает их использование оптимальным образом для множества приложений.

Централизация управления данными с помощью СУБД обеспечивает совместимость этих данных, уменьшение синтаксической и семантической избыточности, соответствие данных реальному состоянию объекта, разделение хранения данных между пользователями и возможность подключения новых пользователей. Но централизация управления и интеграция данных приводят к проблемам другого характера: необходимости усиления контроля вводимых данных, необходимости обеспечения соглашения между пользователями по поводу состава и структуры данных, разграничения доступа и секретности данных.

Основными способами организации БД являются создание централизованных и распределенных БД. Основным критерием выбора способа организации ИБ является достижение минимальных трудовых и стоимостных затрат на проектирование структуры ИБ, программного обеспечения системы ведения файлов, а также на перепроектирование ИБ при возникновении новых задач.

К организации БД предъявляются следующие основные требования:

∙  логическая и физическая независимость данных (программ от изменений структуры БД);

∙  контролируемая избыточность данных;

∙  стандартизация данных за счет использования классификаторов;

∙  наличие словаря данных;

∙  специализация интерфейса для администратора БД и пользователя системы;

∙  контроль целостности данных;

∙  защита данных от несанкционированного доступа;

∙  наличие вспомогательных программных средств (утилит) проектирования и эксплуатации БД.

Принципами построения централизованной БД являются:

∙  обеспечение логической организация данных с помощью построения глобальной модели данных;

∙  представление информационных потребностей для каждой задачи в виде подмоделей данных;

∙  выделение специального языка описания данных для получения схем и подсхем;

∙  описание процедур обработки данных с использованием языка манипулирования данными;

∙  разделение доступа к полям данных;

∙  защита данных через пароль;

∙  обеспечение доступности данных одновременно для нескольких пользователей.

Для распределенных БД существуют свои требования:

∙  учета территориального расположения подразделений ЭИС;

∙  обеспечения независимости данных от их территориального расположения;

∙  оптимального размещения БД между абонентами и серверами;

∙  сокращения стоимости информационного обслуживания абонентов;

∙  обеспечения решения сложных межведомственных задач;

∙  надежности хранения обработки данных; использования СУБД, которые имеют язык описания данных, манипулирования данными и язык запросов, ориентированные на работу в сети;

∙  возможности параллельного обращения к данным из различных узлов обработки данных.