1. Контрольные журналы

Необходимо обеспечить возможность сохранять записи об успешных изменениях в данных в базе данных и в некоторых случаях — запись о транзакциях, которые запрашивают данные и генерируют отчеты. Эта запись может включать соответствующие значения данных, подробности транзакции и идентификацию пользователя. Эти контрольные журналы могут быть определены, как требуемые для всех данных в базе данных, избранных типов данных или экземпляров определяемых данных.

  1. Восстановление

База данных должна иметь возможность возвратиться к предшествующему непротиворечивому состоянию. Это требование может возникнуть из-за ошибочных транзакций, системного сбоя или потери хранимых данных. Чтобы удовлетворить эти требования, могут использоваться различные механизмы, такие как запись всех изменений, сделанных в базе данных, и сохранение резервных копий всей базы данных или ее части.

Модифицированные данные, которые распределяются в более чем одной базе данных, должны быть восстановлены таким образом, чтобы конечный результат имел непротиворечивое состояние и состояние базы данных было бы непротиворечивым.

  1. Логическое реструктурирование данных. Реорганизация физической памяти

Логическое реструктурирование данных определяется как процесс изменения определения данных после того, как информационная система использовалась в течение некоторого времени. Изменение может быть дополнением к существующему определению данных или может заключать в себе модификацию части существующего определения данных.

Реорганизация физической памяти определяется как процесс изменения представления посто­янных данных на носителе данных.

4.8 Дополнительные эксплуатационные требования для поддержки управления данными в рас­пределенной информационной системе

В распределенной информационной системе объекты, принадлежащие одной информацион­ной системе, распределяются на два или более компьютера. Когда распределяемые объекты являются объектами базы данных, система является распределенной системой баз данных.

Запрашиваемая услуга может быть доступна из множества вычислительных устройств, вмеща­ющих дублированные данные.

Эксплуатационные требования, зависящие от распределяемых данных, следующие:

  • управление распределением;

  • управление транзакцией базы данных;

  • связь;

  • экспорт/импорт;

  • независимость распределения.

Некоторые из этих требований также применимы к информационной системе, которая вклю­чает более чем одну среду базы данных в единственной компьютерной системе.

Необходимо поддерживать среду других возможностей:

  1. распределенную систему базы данных, в которой составные среды базы данных проектиру­ются таким образом, что возможно взаимодействие между любой парой;

  2. систему баз данных, в которой две или более отдельно спроектированные системы баз данных объединяются, в определенном смысле, после периода раздельного использования и созда­ются для функционирования как одна распределенная система баз данных;

  3. ситуацию, в которой каждая среда базы данных согласуется множеством стандартов и, следовательно, может взаимодействовать (возможно, на специальной основе) с другими средами баз данных, каждая из которых была спроектирована отдельно, но согласно тем же самым стандартам.

  1. Управление распределением

Управление распределением включает управление фрагментацией, управление дублированием и автономию месторасположения.

Могут использоваться такие способы распределения данных:

  1. назначить все экземпляры определенного типа на одну среду базы данных (нефрагменти- рованный способ);

  2. назначить множества экземпляров данных (возможно различных типов) на две или более среды баз данных (горизонтальная фрагментация);

  3. назначить экземпляры различных частей того же самого типа на две или более среды баз данных (вертикальная фрагментация);

  4. комбинация пунктов б) и в) (комбинированная горизонтальная и вертикальная фрагмента­ция).

Горизонтальная фрагментация дает возможность записывать на вычислительном устройстве только экземпляры данных, которые относятся к этому вычислительному устройству.

Вертикальная фрагментация дает возможность записывать на конкретном вычислительном устройстве только экземпляры данных, которые относятся к нему.

Если фрагментация поддерживается в распределенной среде, то не требуется, чтобы пользова­тель информационной системы знал, как данные фрагментируются или распределяются между компьютерными системами.

По причинам производительности или защиты от сбоя компьютерной системы необходимо обеспечить копию всей базы данных или ее части. Такие дублированные данные могут храниться в компьютерной системе, отличной от той, в которой данные первоначально создаются и в дальней­шем управляются. Требование для фрагментации может быть объединено с требованием дублиро­вания так, чтобы копии множества фрагментов назначались на две или более среды баз данных. Информация о том, какие объекты, в какой среде данных являются доступными, должна быть доступна (прямо или непрямо) в каждой среде.

Необходимо иметь возможность управлять содержанием точных копий, когда данные обнов­ляются. Алгоритмы, которые обеспечивают контроль точных копий, должны также гарантировать обновления в транзакциях.

Требования для дублирования данных на различных компьютерных системах должны быть адресованы в связи с требованием для компьютерных систем быть автономными, насколько это возможно. Такие требования относятся к производительности, доступности данных в течение сбоя связи и к административным вопросам, таким как учет системных ресурсов и идентифицирование пользователей.

  1. Управление транзакцией базы данных

Необходимо синхронизировать действия локальных систем управления транзакцией, чтобы гарантировать, что изменения в распределенных данных заканчиваются непротиворечивым состоя­нием для каждой базы данных, а также для всех баз данных.

Обработка в одной компьютерной системе может осуществляться параллельно с обработкой в другой компьютерной системе без влияния на целостность данных в каждой из компьютерных систем.

  1. Связи

Необходимо обеспечить информационным системам возможность связываться друг с другом.

Для обмена объектов данных необходимо, чтобы средство моделирования данных, в соответ­ствии с которым объекты данных структурируются, было использовано в каждой из компьютерных систем.

Необходимо иметь средства, которые предотвращают потерю целостности баз данных из-за таких видов сбоя связи:

  • сообщение может быть потеряно во время передачи;

  • сообщение не может поступить в надлежащем виде из-за ошибок трансляции и ретрансля­ции;

  • при некоторых обстоятельствах сбой связи трудно отличить от сбоя на удаленном вычисли­тельном устройстве.

Следует определить необходимую степень дублирования данных.

  1. Экспорт-импорт

Данные экспортируются из одной среды и импортируются в другую. Для этого необходимо иметь копию части или всей базы данных, с определением данных или без него. Однажды экспор­тируемые данные могут быть импортированы во многие другие среды, если это требуется, а также сохраняться.

  1. Независимость распределения

Прикладной процесс должен иметь доступ к данным в распределенной базе данных таким образом, чтобы он не зависел от того, как могут быть распределены данные.

  1. Пары уровней и связанных процессов

    1. Пары уровней

Конструкция «пара уровней» является способом объяснения связей между базой данных и схемой. Графическое представление на рисунке 7 применяется для иллюстрации соединения базы данных с ее определением

.

База данных


Рисунок 7 — Конструкция «пара уровней»

Влияние конструкции «пара уровней» состоит в том, что каждая база данных соответствует структуре данных, определенной в связанной с ней схеме. Значения данных в базе данных могут обрабатываться только процессами манипулирования данными, связанными со схемой базы данных. Схема устанавливает точную форму разрешенной обработки. Поэтому конструкция «пара уровней» иллюстрирует средство для достижения непротиворечивых операций манипулирования данными.

Представление и интерпретация значений данных зависят от схемы. Обработка не может осуществляться до тех пор, пока схема не будет определена и активна. Когда требуются изменения в схеме, тогда связанная с ней база данных должна быть таким образом изменена, чтобы поддержи­вать непротиворечивость.

  1. Блокирование пар уровней

Конкретная схема не только определяет данные, но и сама является набором сложных объектов данных, которые должны быть созданы и защищены и могут быть модифицированы. Средства управления данными являются пригодными для управления схемами. Схема в паре уровней может быть представлена в базе данных более высокого уровня, структура данных которой может быть определена схемой более высокого уровня. Эта база данных и схема составляют другую, более высокую пару уровней. Две пары уровней могут быть «блокированы», как показано на рисунке 8.

Схема-2

В

База данных-2

Схема-1

ключает
представление
схемы-1

База данных-1

Рисунок 8 — Блокирование пары уровней

В соответствии с рисунком 8 база данных-1 согласована со схемой-1. Данные в базе данных-1 могут быть обработаны процессами манипулирования данными, которые соединены со схемой-1. База данных-2 соответствует схеме-2, и данные в базе данных-1 могут быть обработаны процессами манипулирования данными, которые соединены со схемой-2. Представление схемы-1 в базе дан­ных-2 является исходной схемой. Исходная схема может быть выбрана из базы данных или, наоборот, обрабатываться операторами манипулирования данными точно так же, как и любые данные в базе данных.

Две пары уровней находятся на разных уровнях определения данных. Если схема-2 (рисунок 8) может иметь представление в форме экземпляров данных, записанных в базе данных, то понятие блокирования пар уровней есть рекурсивное понятие и может использоваться двумя и более парами уровней. Рекурсия останавливается, когда определение данных больше не может модифицироваться. 10Обобщенное блокирование пар уровней приведено на рисунке 9.


(N+1) база данных


(N)

база данных



Рисунок 9 — Обобщенное блокирование пар уровней

Общие метки N и N+1 используются, чтобы показать более высокие уровни при рассмотрении общих свойств.

Блокирование пар уровней происходит с помощью связывания схемы пары уровней (N) с базой данных следующей пары уровней (N+1). Первая называется схемой (N), вторая — базой данных (N+1).

Реализация базы данных включает в себя процессы создания и поддержки определений данных. Эти определения становятся доступными для процессов манипулирования данными, затем выпол­няются операции выборки и модификации данных в базе данных.

Рисунок 9 иллюстрирует приведенные выше процессы следующим образом:

  1. база данных (N) представляет данные, фактически предназначенные для манипулирования на уровне (N);

  2. схема (N) представляет схему, способную управлять процессами для пары уровней (N). Эта схема содержит определения данных только для базы данных (N);

  3. база данных (N+1) содержит определения данных, которые были созданы в течение про­цесса проектирования для базы данных (N) и поддерживались в течение системной операции. База данных (N+1) может также содержать другие данные, такие, например, как описания этих опреде­лений данных и проектов и описания процессов, которые используют их;

  4. база данных (N+1) может содержать представления одной или более схем (N) в исходной форме. После того как одна из этих исходных схем (N) была выбрана, активизированный процесс может быть использован, чтобы конвертировать исходную схему (N) в форму, называемую объектной схемой, таким образом, чтобы могла быть заполнена связанная с ней база данных (N). Исходная схема (N) может быть активизирована более чем один раз, и каждая активизация создает отдельную объектную схему (N) со связанной с ней базой данных (N), которая может заполняться, используя процессы манипулирования данными.

Блокирование имеет пару самого низкого уровня, для которой данные на более низком уровне этой пары не содержат данные о схеме и ее компонентах и, следовательно, не могут быть активи­зированы. Эта пара уровней является тогда частью прикладной системы, и данные на более низком уровне этой пары уровней являются прикладной базой данных.

Блокирование также имеет пару самого высокого уровня, для которой схема на более высоком уровне пары уровней не записывается в базе данных более высокого уровня. Эта схема является тогда неявной в средстве моделирования данных, используемом системой управления данными.

  1. Зависимость пар уровней от средства моделирования данных

Конструкция «пара уровней» и понятие средства моделирования данных тесно взаимосвязаны. Средство моделирования данных заключает в себя множество правил структурирования данных и связанное с ним множество правил манипулирования данными.

  1. Пары уровней и правила структурирования данных

Средство моделирования данных включает совокупность правил структурирования данных, которые должны быть использованы для определения схемы. Эти правила включают правила для определения ограничений, которые могут быть частью схемы. Каждая схема должна быть полной и непротиворечивой в соответствии с правилами структурирования данных и связанного с ними средства моделирования данных.