База даних повинна мати можливість повернутися до попереднього несуперечливого стану. Ця вимога може виникнути через помилкові транзакцїї, системну аварію або втрату даних, що зберігаються. Щоб задовольнити ці вимоги, можуть використовуватися різні механізми, такі, як запис всіх змін, зробле­них у базі даних, і зберігання резервних копій всієї бази даних або її частини.

Модифіковані дані, які розподіляються у більше, ніж одну базу даних, повинні бути відновлені та­ким чином, щоб кінцевий результат мав несуперечливий стан і стан бази даних був несуперечливим.

  1. Логічне реструктурування даних. Реорганізація фізичної пам'яті

Логічне реструктурування даних визначається, як процес зміни визначення даних після того, як інформаційна система використовувалася протягом певного часу. Зміна може бути додатком до існуючого визначення даних або може містити модифікацію частини існуючого визначення даних.

Реорганізація фізичної пам’яті визначається як процес зміни подання сталих даних на носії даних.

5.8 Додаткові експлуатаційні вимоги для підтримки керування даними в розподіленій інформаційній системі

У розподіленій інформаційній системі об’єкти, які належать до однієї інформаційної системи, розпо­діляються на два або більше комп'ютери. Коли розподілювані об'єкти є об’єктами бази даних, система є розподіленою системою баз даних.

Запитувана послуга може бути доступною з якоїсь кількості обчислюваних пристроїв, що містять дубльовані дані.

Експлуатаційні вимоги, які залежать від розподілених даних, такі:

  • керування розподілом;

  • керування транзакцією бази даних;

  • зв’язок;

  • експорт/імпорт;

  • незалежність розподілу.

Деякі з цих вимог також можуть застосовуватися до інформаційної системи, яка містить більше, ніж одне середовище бази даних в одній комп’ютерній системі.

Необхідно підтримувати серед інших можливостей:

  1. розподілену систему бази даних, в якій складові середовища бази даних проектуються таким чином, що є можливою взаємодія між будь-якою парою;

  2. систему баз даних, в якій дві або більше окремо спроектованих системи баз даних об’єднуються, в певному розумінні, після періоду окремого використання і створюються для функціювання як одна розподілена система баз даних;

  3. ситуацію, коли кожне середовище бази даних узгоджується сукупністю стандартів і, отже, може взаємодіяти (можливо, на спеціальній підставі) з іншими середовищами баз даних, кожне з яких було спроектовано окремо, але відповідно до тих самих стандартів.

  1. Керування розподілом

Керування розподілом включає керування фрагментуванням, керування дублюванням та автономію місцеперебування.

Можуть використовуватися такі способи розподілення даних:

  1. призначити всі примірники певного типу на одне середовище бази даних (нефрагментований спосіб);

  2. призначити множини примірників даних (можливо різних типів) на два або більше середовища баз даних (горизонтальне фрагментування);

  3. призначити примірники різних частин того самого типу на два або більше середовища баз даних (вертикальне фрагментування);

  4. комбінація пунктів переліку б) і в) (комбіноване горизонтальне й вертикальне фрагментування).

Горизонтальне фрагментування дає можливість записувати на обчислювальному пристрої лише примірники даних, які належать до цього обчислювального пристрою.

Вертикальне фрагментування дає можливість записувати на конкретному обчислювальному при­строї лише примірники даних, які належать до нього.

Якщо фрагментування підтримується в розподіленому середовищі, то не вимагається, щоб корис­тувач інформаційної системи знав, як дані фрагментуються або розподіляються між комп’ютерними си­стемами.

З міркувань продуктивності або захисту від аварії комп’ютерної системи слід забезпечити копію всієї бази даних або її частини. Такі дубльовані дані можуть зберігатися в комп'ютерній системі, відмінній від тієї, де дані початково створюються і далі керуються. Вимогу фрагментування може бути поєднано з вимогою дублювання таким чином, щоб копії множини фрагментів призначалися на два або більше середовища баз даних, інформація про те, які об'єкти в якому середовищі даних є доступними, повинна бути доступна (прямо або непрямо) в кожному середовищі.

Слід мати можливість керувати змістом точних копій, коли дані оновлюються. Алгоритми, які забез­печують контроль точних копій, мають також ґарантувати оновлення в транзакціях.

Вимоги для дублювання даних на різних комп’ютерних системах мають бути адресовані у зв’язку з вимогою для комп'ютерних систем бути автономними, наскільки це можливо. Такі вимоги стосуються продуктивності, доступності даних під час аварії зв'язку і адміністративних питань, таких, як облік сис­темних ресурсів та ідентифікування користувачів.

  1. Керування транзакцією бази даних

Слід синхронізувати дії локальних систем керування транзакцією, щоб ґарантувати, що зміни в розподілених даних закінчуються несуперечливим станом для кожної бази даних, а також для всіх баз даних.

Оброблення в одній комп’ютерній системі може відбуватися паралельно з обробленням в іншій комп’ютерній системі без впливу на цілісність даних у кожній з комп’ютерних систем.

  1. Зв'язки

Слід забезпечити інформаційним системам можливість зв’язуватися одна з одною.

Для обміну об’єктів даних необхідно, щоб засіб моделювання даних, згідно з яким об'єкти даних структуруються, був використаний у кожній з комп’ютерних систем.

Слід мати засоби, які запобігають втраті цілісності баз даних через такі види відмов зв’язку:

  • повідомлення може загубитися під час пересилання;

  • повідомлення не може надійти у належному вигляді через помилки трансляції та ретрансляції;

  • за певних обставин збій зв’язку важко відрізнити від збою на віддаленому обчислювальному пристрої.

Слід визначити необхідний ступінь дублювання даних.

  1. Експорт-Імпорт

Дані експортуються з одного середовища й імпортуються в інше. Для цього потрібно мати копію частини чи всієї бази даних з визначенням даних або без нього. Один раз експортовані, дані можуть імпортуватись у багато інших середовищ, якщо це потрібно, а також зберігатися.

  1. Незалежність розподілення

Прикладний процес повинен мати доступ до даних у розподіленій базі даних таким чином, щоб він не залежав від того, як можуть бути розподілені дані.

  1. ПАРИ РІВНІВ І ЗВ’ЯЗАНИХ ПРОЦЕСІВ

    1. Пари рівнів

Конструкція “пара рівнів" є способом пояснення зв’язків між базою даних і схемою. Графічне зобра­ження на рисунку 7 застосовується для ілюстрації з’єднування бази даних з її визначенням.

база даних



Рисунок 7 - Конструкція “пара рівнів"

Вплив конструкції “пара рівнів” полягає в тому, що кожна база даних узгоджується зі структурою даних, визначеною у зв'язаній з нею схемі. Значення даних у базі даних можуть оброблятися лише процесами маніпулювання даними, зв’язаними зі схемою бази даних. Схема визначає точну форму доз­воленого оброблення. Тому конструкція “пара рівнів" ілюструє засіб для досягнення несуперечливих операцій маніпулювання даними.

Подання та інтерпретування значень даних залежить від схеми. Обробка не може здійснюватися до того часу, поки схема не буде визначена і активна. Коли потрібні зміни в схемі, тоді зв'язана з нею база даних повинна бути відповідно змінена, щоб підтримувати несуперечливість.

  1. Блокування пар рівнів

Конкретна схема не лише визначає дані, але й сама є набором складних об'єктів даних, які повинні бути створені й захищені і можуть модифікуватися. Засоби керування даними є придатними для керу­вання схемами. Схема в парі рівнів може подаватися в базі даних вищого рівня, структура даних якої може бути визначена схемою вищого рівня. Ця база даних і схема складають іншу, вищу пару рівнів. Дві пари рівнів можуть бути “блоковані”, як показано на рисунку 8.

Згідно з рисунком 8 базу даних-1 узгоджено зі схемою-1. Дані в базі даних-1 можуть бути оброблені процесами маніпулювання даними, з’єднаними зі схемою-1. База даних-2 відповідає схемі-2, і дані в базі даних-1 можуть бути оброблені процесами маніпулювання даними, з'єднаними зі схемою-2. Подання схеми-1 у базі даних-2 є початковою схемою. Початкова схема може вибиратися з бази даних або, навпаки, оброблятися операторами маніпулювання даними так само, як і будь-які дані у базі даних

.



Дві пари рівнів перебувають на різних рівнях визначення даних. Якщо схема-2 (рисунок 8) може мати подання у формі примірників даних, записаних у базі даних, то поняття блокування пар рівнів є рекурсивним поняттям і може використовуватися двома і більше парами рівнів. Рекурсія зупиняється, коли визначення даних більше не може модифікуватися.

Включає подання схеми-1





Р

база даних-1

исунок 8 - Блокування пари рівнів


У

(N) база даних

загальнене блокування пар рівнів подано на рисунку 9.

Рисунок 9 - Узагальнене блокування пари рівнів

Загальні позначки N та N+1 використовуються, щоб показати вищі рівні при розгляді загальних властивостей.

Блокування пар рівнів відбувається за допомогою зв'язування схеми пари рівнів (N) з базою даних наступної пари рівнів (N+1). Перша називається схемою (N), друга — базою даних (N+1).

Реалізація бази даних містить процеси створення та підтримки визначень даних. Ці визначення стають доступними для процесів маніпулювання даними, потім виконуються операції вибирання та модифікування даних у базі даних.

Рисунок 9 ілюструє раніше наведені процеси таким чином:

  1. база даних (N) подає дані, фактично призначені для маніпулювання на рівні (N);

  2. схема (N) подає схему, здатну керувати процесами для пари рівнів (N). Ця схема містить визна­чення даних лише для бази даних (N);

  3. база даних (N+1) містить визначення даних, створених під час процесу проектування для бази даних (N) і підтримуваних протягом системної операції. База даних (N+1) може також містити інші дані, а не лише визначення даних, такі, наприклад, як описи цих визначень даних та проектів і описи процесів, які використовують їх;

  4. база даних (N+1) може містити подання однієї або більше схем (N) у початковій формі. Після того, як одну з цих початкових схем (N) обрано, активований процес може використовуватися, щоб кон­вертувати початкову схему (N) у форму, названу об’єктною схемою, таким чином, щоб можна було за­повнити зв’язану з нею базу даних (N). Початкова схема (N) може бути активована більше, ніж один раз, і кожна активація створює окрему об’єктну схему (N) зі зв’язаною з нею базою даних (N), яку можна заповнити з використанням процесів маніпулювання даними.

Блокування має пару найнижчого рівня, для якої дані на нижчому рівні цієї пари не містять дані про схему та її компоненти і, отже, їх не можна активувати. Ця пара рівнів є тоді частиною прикладної систе­ми, і дані на нижчому рівні цієї пари рівнів є прикладною базою даних.

Блокування також має пару найвищого рівня, для якої схема на вищому рівні пари рівнів не запи­сується в базі даних вищого рівня. Ця схема є тоді неявною в засобі моделювання даних, який викори­стовується системою керування даними.

  1. Залежність пар рівнів від засобу моделювання даних

Конструкція “пара рівнів” і поняття засобу моделювання даних взаємопов'язані. Засіб моделюван­ня даних охоплює сукупність правил структурування даних та пов'язану з ним сукупність правил маніпулювання даними.

  1. Пари рівнів І правила структурування даних '

Засіб моделювання даних містить сукупність правил структурування даних, які повинні використо­вуватися для визначення схеми. Ці правила містять правила для визначення обмежень, які можуть бути частиною схеми. Кожна схема повинна бути повною і несуперечливою відповідно до правил структуру­вання даних і пов'язаного з ними засобу моделювання даних.

  1. Пари рівнів І правила маніпулювання даними

Засіб моделювання даних також містить правила для семантики процесів маніпулювання даними. Для схеми (N) обмеження, що базуються на правилах структурування даних, впливають також на семан­тику оновлення процесів маніпулювання даними, які виконуються над базою даних.

  1. Пари рівнів і зв’язані з ними процеси

Дані в базі даних можна одержати або модифікувати серією процесів маніпулювання даними. Крім того, якщо частина цих даних містить початкову схему, то можна виконувати активований процес над даними.

Рисунки 10 і 11 ілюструють, як правила структурування даних, які використовуються для визначен­ня схеми (N+1), впливають на процеси маніпулювання даними у базі даних (N). Використовуються такі п’ять процесів маніпулювання даними: (1) — вибирати, (2) — активувати, (3) — зв’язувати з правилами маніпулювання даними, (4) — зв'язувати з правилами структурування даних і (5) — вибирати або модифікувати. Цифри від 1 до 5 позначають кроки, які пояснюються у подальших рисунках. Рисунки 10 і 11 є розширенням рисунка 9, для того, щоб показати активацію, схемні з'єднання, проміжні вибирання даних і підготовку та дію інших процесів маніпулювання даними.

Такі кроки описують відповідні процеси (рисунки 10 і 11) і показують, як правила засобу моделюван­ня даних дають можливість процесу маніпулювання даними (N) коректно керувати базою даних (N).