Служби для підтримування природної мови містять таке.

Підтримування декількох мов. Прикладна платформа повинна бути здатна підтримувати більше однієї мови одночасно. Наприклад, один процес міг би забезпечувати французьку мову, у той час як Інший процес — японську. Прикладна платформа повинна надавати користувачам вибір найзручні­шої мови для комунікацій із прикладною програмою та дозволяти динамічне перемикання на іншу мову. Також прикладна платформа повинна бути здатна призначати задану за промовчанням мову, і*рун- туючись на параметрах прикладної платформи, спеціалізованої робочої станції, ідентифікаторі чи уподобанні користувача застосування.

Система обміну повідомленнями природною мовою. Прикладна платформа повинна бути здатна подавати (на дисплеї, в роздруковці тощо) повідомлення, меню, форми й інтерактивну документацію обраною користувачем мовою. Одночасно підтримувати різні мови для різних користувачів, дозволяти користувачу перемикати мови. Треба також правильно обробляти такі аспекти:

  • незалежність від природної мови. Елементи програмного коду застосування не повинні залежати від будь-якої природної мови, одночасно забезпечуючи повідомлення природною мовою, уживаною всередині обраного користувачем міжнаціонального середовища;

  • змінна довжина повідомлення. Прикладна платформа повинна підтримувати подавання повідомлення змінної довжини, оскільки трансляція в інші мови змінює довжину повідомлення; англій­ський текст зазвичай набагато коротше у порівнянні з тим самим текстом, наприклад, на німець­кій чи фінській мовах. Для зміни розміщення в полі відображення повинна бути доступна достатня ді­лянка пам'яті;

  • вбудовування параметрів та порядок слів. Прикладна платформа повинна бути здатна вставляти змінні параметри у повідомлення в порядку, що відповідає обраній користувачем природ­ній мові;

  • підтримування локальних клавіатур. Прикладна платформа повинна бути здатна правильно інтерпретувати ввід із клавіатур, модифікованих для локальних наборів символів;

  • взаємодія користувача з локальною мовною системою. Прикладна програма повинна бути здатна приймати необхідний увід від користувача обраною мовою, незалежно від логіки прикладної програми, поданої конкретною природною мовою з набором культурних угод. Наприклад, багато застосувань використовують упорядкування за першими відміченими символами; цей метод не прий­нятний у міжнаціональній системі. У перекладі повідомлення користувача змінюється перший сим­вол; у результаті більше одного повідомлення можуть мати той самий початковий символ, і логіка програми порушується. До того ж, багато мов повинні підтримуватися одночасно.

  1. Служби АРІ. Усі загальні служби, визначені в 5.1.4.1, повинні бути доступні застосуван­ням через запити до АРІ. Служби АРІ структурують тим самим способом, що й запитувані загальні служби.

    1. Культурні угоди.

Виклик культурних угод. Прикладна платформа повинна підтримувати для прикладної про­грами виклик специфічної культурної угоди з репозитарію. Якщо в прикладній програмі не зроблено вибір, треба автоматично викликати заданий за промовчанням набір угод.

Зміна культурних угод. Прикладна платформа повинна динамічно заміняти вживану культурну угоду за запитом прикладної програми чи користувача.

Надавання локальних значень. За запитом прикладної програми прикладна платформа повинна повертати локальні формати часу, дат, календаря, числових полів, полів грошової одиниці та інших символів.

Локальне впорядкування та порівняння. За запитом прикладної програми прикладна платформа повинна порівнювати та сортувати дані за локальними правилами впорядкування, визначеними у ре- позитарїї культурних угод.

  1. Підтримування природної мови.

Вибір мови. Прикладна платформа повинна надавати повщомлення, меню, форми, інтерактивну документацію та здійснювати взаємодію користувача із системою природною мовою, обраною корис­тувачем або автоматично системою, на підставі попередньо заданих параметрів для прикладної програми, сеансу, користувача чи системи.

Зміна мови. За запитом користувача прикладна платформа повинна бути здатна динамічно змінювати звертання до конкретного користувацького застосування, мову повідомлень, меню, форми, інтерактивну документацію та взаємодію користувача із системою.

  1. Інструментарій локалізації. Інтернаціоналізація прикладних платформ та застосувань — підстава для їхньої локалізації у різних країнах. Для користувача важливо, щоб локалізацію виконували добре та організовано, без необхідності знання внутрішньої структури прикладної платформи чи при­кладної програми. Наступні служби для інструментарію локалізації — ключ до успішної локалізації при­кладних платформ та застосувань:

Служби репозитарію наборів символів. Забезпечують установку та підтримування репозита- ріїв наборів символів. Допускають додавання нових наборів символів до репозитарію.

Служби репозитарію культурних угод. Повинні забезпечувати встановлення та підтримування репозитаріїв культурних угод, додавання нових культурних середовищ. Обумовлені користувачем таб­лиці порівняння — суттєві частини репозитарію; для їхнього визначення та підтримування повинні забезпечуватися відповідні послуги.

Служби підтримування трансляції. Повинні забезпечити установку та підтримування файлів по­відомлень, меню, форм, інтерактивної документації та таблиць взаємодії користувача із системою для локальної мови та додавання нових мов. До того ж, будь-які служби трансляції повинні давати змогу керування змінами для трансляції тільки нових чи редагованих текстів, необхідних для нових версій програм.

5.1.5 Стандарти, специфікації та недокументовані служби

Не Існує великої кількості доступних стандартів, що мають справу з інтернаціоналізацією. Біль­шість актуальних стандартів описує набори символів керування та графічних символів для різних схем кодування (семибітних, восьмибітних тощо). Деякі стандарти спрямовані на формати часу та дат, інші — стосуються другорядних питань оголошення даних.

Приклад того, як сьогодні підтримують культурні угоди і мови, — функція setlocale(). Остання дозволяє розробнику прикладної програми вибирати окремі або всі визначені властивості підтриму­вання для національних мов І локальних культурних угод. Окремі властивості, зв’язані з катего­ріями, відповідають ділянкам функціональності; нині підтримують — класифікацію символів, упоряд­ковані послідовності, формат дат/часу, формат валюти і числовий формат. Інші категорії виду оброб­лення повідомлень також, імовірно, реалізовуватимуться. Див. таблицю 28.

Таблиця 28 — Стандарти Інтернаціоналізації

Служби

Тип

Специфікація

Підрозділ

Наборів символів/подання

S

ISO 646:1991, ISO/IEC 2022:1994, ISO 4031:1987, ISO 4217:1990, ISO/IEC 4873:1991, ISO 6093:1985, ISO/IEC 6429:1992, ISO 6936:1988, ISO/IEC 6937:1994, ISO/IEC 7350:1991, 150 8601:1988, ISO/IEC 8859-1:1998, ISO/IEC 8859-2:1999, ISO/IEC 8859-3:1999, iSO/ІЄС 8859-4:1998, ISO/IEC 8859-5:1999, ISO/IEC 8859-6:1999, ISO 8859-7:1987, ISO/IEC 8859-8:1999, ISO/IEC 8859-9:1999, ISO/IEC 8859-10:1998, ISO/IEC 8859-13:1998, ISO/IEC 8859-14:1998, ISO/IEC 8859-15:1999, ISO/IEC 10367:1991, ISO/IEC 10646-1:2000, ITU-T T.61.GB 2312-1980, JIS X0208-1990, KS 3 5601-1987

5.1.5.1

Культурних угод

S

ISO 2014:1976, ISO 3307:1975

5.1.5.1

Підтримки природної мови

S

ISO/IEC 9995-1:1994, ISO/IEC 9995-2:1994/Amd 1:1999, ISO/IEC 9995-3:1994/Amd 1:1999, ISO/IEC 9995-4:1994, JSO/JEC 9995-5:1994, ISO/IEC 9995-6:1994, ISO/IEC 9995-7.1994/ /Arnd 1:1996. ISO/IEC 9995-8:1994 (ISO/IEC 9995:1994), CAN/CSA-Z243.200-92

5.1.5.1



  1. Стандарти POSIX-OSE. Стандарти, перелічені у цьому підрозділі, є частиною POSIX-OSE.

    1. Міжнародні стандарти. ISO 646:1991 визначає двійкове подавання 128 символів ке­рування, літер латиниці, цифр І символів. Загалом описують використання символів керування і опції заміни на символи національних абеток природних мов.

ISO 2014:1976 визначає запис дат Григоріанського календаря в загально числовій формі, поданій елементами — рік, місяць і день.

ISO/IEC 2022:1994 визначає методи для розширення числа символів, що є основним набором символів; відкорегований у 1999 році.

ISO 3307:1975 встановлює єдине подання часу, що ґрунтується на 24-годинній системі хроно­метрування. Надає засоби для відображення в цифровій формі місцевого часу доби й універсального часу (за Гринвічем) із метою обміну інформацією між системами даних.

ISO 4031:1987 визначає стандартні засоби подання диференційованого місцевого часу для полегшення обміну даними між системами даних.

ISO 4217:1990 визначає подання валют І позначень грошової одиниці.

ISO/IEC 4873:1991 окреслює структуру 8-ми бітного коду ISO і правила її реалізації.

ISO 6093:1985 визначає три подання числових значень для відображення в символьних рядках форм, призначених для машинного зчитування, для використання в обміні даними між системами оброблення даних. Також наводить настанову для розробників стандартів мов програмування і конструкторів програмних продуктів. Люди розпізнають ці подання, і вони можуть бути корисні в спіл­куванні між людьми.

ISO/IEC 6429:1992 визначає функції керування й їхні кодовані подання для використання в 7-ми бітному коді, розширеному 7-ми бітному коді, 8-ми бітному коді чи розширеному 8-ми бітному коді. Визначає набори С0 і С1, отримані з них функції керування і ряд незалежних функцій керування.

ISQ 6936:1988 визначає правила перетворення між 58-ми символьним поданням ІТА2 і 128-ми символьним поданням ISO 646:1991.

ISO/IEC 6937:1994 визначає умови і поняття, використовувані в описі і застосуванні подання символьних наборів. Визначає сукупність абеткових і неабеткових символів латиниці. Визначає двій­кове подання символів. Описує правила для визначення і використання наборів символів, що є під- множинами всього репертуару.

ISO/IEC 7350:1991 визначає процедури для готування, реєстрування, випускання і підтримування реєстру наборів графічних символів, складених із символьного репертуару ISO 6937:1994, і про­цедур для призначення ідентифікаторів наборам символів. Зазначимо, що згідно з ISO 2375 до кінця 80-х років різні кодові таблиці реєстрував в ISO-регістрі спеціальний орган International Registration Author. Із запровадженням ISO/IEC 10646-1:1993 фактично відмовилися від визнання декількох ко­дових таблиць однієї мови, встановивши єдиний стандартизований репертуар символів із універсаль­ним методом UCS-кодування.

ISO 8601:1988 визначає подання дат A.D. нашої ери (anno Domini) за Григоріанським кален­дарем, відображення часу і подання часових періодів. Застосовують кожного разу у випадку вне­сення дати і часу в Інформаційний обмін.

ISO/IEC 8859 у 13 чинних частинах визначає набір до 191 графічних символів за допомогою одного 8-бітного байта. Частини стандарту визначають такі набори для UTF-кодування кирилиці, арабського І грецького алфавітів і 9 алфавітів латиниці для всіх мов Європи:

  1. Латиниця № 1 (ISO/IEC 8859-1:1998);

  2. Латиниця № 2 (ISO/IEC 8859-2:1999);

  3. Латиниця № З (ISO/IEC 8859-3:1999);

  4. Латиниця № 4 (ISO/IEC 8859-4:1998);

  5. Латиниця/кирилиця (ISO/IEC 8859-5:1999);

  6. Патілняця/арабська абетка (ISO/IEC 8859-6:1999)’,

  7. Латиниця/грецька абетка (ISO 8859-7:1987);

  8. Латиниця/Іврит (ISO/IEC 8859-8:1999);

  9. Латиниця № 5 (ISO/IEC 8859-9:1999);

  10. Латиниця № 6 (ISO/IEC 8859-10:1998);

  11. Латиниця № 7 (ISO/IEC 8859-13:1998);

  12. Латиниця № 8 (кельтська) (ISO/IEC 8859-14:1998);

  13. Латиниця № 9 (ISO/IEC 8859-15:1999);

ISO/IEC 9899:1999 визначає розширення стандарту мови Сі для оброблення мультиоктетних символів.

ISO/IEC 9995:1994 у восьми частинах із численними поправками визначає розміщення сим­волів на клавіатурі під час уводу багатомовної інформації.

ISO/IEC 10367:1991 специфікує унікальний набір із 96 графічних символів, відображуваних як еле­менти 8-бІтного коду GO, G1, G2 і G3. Специфікує колекцію кодових наборів графічних символів, структурно подібних ISO/IEC 4873:1991. У колекцію (табл. 29) входять базовий GO-набір, що міс­тить у стовпчиках 02-07 таблиці основну частину латиниці, і 12 кодових наборів у стовпчиках 10-15, що згідно з ISO 4873 кон’юнктивно доповнюють однобайтну кодову UTF-таблицю.

Таблиця 29 — Нумерація однобайтних кодових UTF-таблиць

Ne

Номер у ISO-регістрі

Назва кодового набору

1

6

Базовий GO-набір

2

100

Додатковий набір латиниці № 1

3

101

Додатковий набір латиниці Ne 2

4

109

Додатковий набір латиниці Ne 3

5

110

Додатковий набір латиниці Ne 4

6

148

Додатковий набір латиниці Ne 5

7

144

Додатковий набір кирилиці

8

127

Додатковий набір арабської абетки

9

126

Додатковий набір грецької абетки

10

138

Додатковий набір Івриту

11

154

Додатковий набір латиниці № 1 чи Ne 5 і 2

12

155

Базовий набір боксів псевдографіки

13

156

Додатковий набір з ISO/IEC 6937



ISO/IEC 10646-1:2000 (результат перегляду попередньої версії 1993 року) визначає подання всіх мов світу в машинних системах і однозначний обмін даними між однією системою чи людиною з ін­шою системою. Застосовують до подання, оброблення, збереження і подання в писемній формі всіма мовами світу текстових даних в універсальному мультиоктетному UCS-коді.