відкритих систем згідно з ДСТУ 4249:2003. Йдеться про організацію трьох видів інтерфейсу (мережного, АРІ І людина-комп'ютер) одиницями обміну, тобто файлами лише у стандартному кодуванні за таблицями UCS-4 та (JCS-2 (Unicode, UTF-8), ДСТУ 4353-5, СР1251 та KOI8-Unified, з обов’язковим наданням користувачеві права вибору способу кодування файлу з однієї з цих таблиць. Усі інші кодування, так само як і нові, що випливають зі специфіки алгоритмів застосувань, треба вважати внутрішніми і, можливо, складовими ноу-хау фірми-розробника застосування.ДСТУ 4353-5:2004
НАЦІОНАЛЬНИЙ СТАНДАРТ УКРАЇНИ
ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ
ВОСЬМ И БІТИ І ОДНОБАЙТНІ НАБОРИ
КОДОВАНИХ ГРАФІЧНИХ СИМВОЛІВ
Частина 5. Латиниця/кирилиця
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
ВОСЬМИБИТНЫЕ ОДНОБАЙТНЫЕ НАБОРЫ
КОДИРОВАННЫХ ГРАФИЧЕСКИХ СИМВОЛОВ
Часть 5. Лати ни ца/ки рилли ца
INFORMATION TECHNOLOGY
8-BIT SINGLE-BYTE CODED
GRAPHIC CHARACTER SETS
Part 5: Latin/Cyrillic alphabet
Чинний з 2006-04-01
СФЕРА ЗАСТОСУВАННЯ
У цьому стандарті визначено набір із 191 кодованого графічного символу, що відповідає об’єднанню абеток латиниці/кирилиці. Цей набір призначено для використання в обробленні текстів і даних, а також в обміні Інформацією.
Набір складено з графічних символів, переважно використовуваних у цільових застосуваннях звичайних офісних систем, що працюють принаймні з такими мовами: болгарська, білоруська, англійська, латинська, македонська (слов’янська), російська, сербська, українська.
Примітка. Дві літери, нещодавно додані до офіційної української абетки, не включено у набір символів цього стандарту. З цього питання підготовлено звіт CEN/CENELEC/PT004 (див. Бібліографію).
Цей набір кодованих графічних символів можна розглядати як версію восьмибітного коду згідно з ISO/IEC 2022 або ISO/IEC 4873 на рівні 1.
Стандарт можна використовувати як сполучну ланку з усіма іншими частинами ISO/IEC 8859. Якщо спільно застосовують кодовані символи більше, ніж з однієї частини, використовуючи методи розширення коду, то еквівалентний набір кодованих символів з ISO/IEC 10367 треба використовувати замість версії ISO/IEC 4873 на рівні 2 чи 3.
Кодовані символи з цього набору можна використовувати у поєднанні з кодованими функціями керування, обраними згідно з ISO/IEC 6429. Однак функції керування не використовують для створення складених графічних знаків із двох чи більше графічних символів (розділ 6).
Примітка. Цей стандарт не призначено для використання службами телематики, визначеними ITU-T. Якщо Інформацію, закодовану згідно з ISO/IEC 8859, перекладають для таких служб, вона має відповідати технічним вимогам цих служб.
Видання офіційне
ВІДПОВІДНІСТЬ СТАНДАРТУ
Відповідність обміну Інформацією
Кодоваяо-символьний елемент даних (КС-елемент — CC-data-efement) всередині закодованої інформації, призначеної для обміну, узгоджено з цим стандартом, якщо всі кодовані подання графічних символів всередині цього КС-елемента даних відповідають технічним вимогам розділу 6.
Узгодження засобів
Засіб узгоджено з цією частиною стандарту, якщо він відповідає технічним вимогам 2.2.1 та одночасно або окремо вимогам 2.2.2 та 2.2.3. Згідно з вимогою відповідності розпізнають документ, що містить опис, специфікований у 2.2.1.
Опис засобів. Засіб, який відповідає цій частині стандарту, може бути об’єктом опису, що Ідентифікує значення, за яким користувач може вводити символи у засіб або розпізнавати їх, якщо вони стають доступними, як визначено у технічних вимогах 2.2.2 та 2.2.3.
Передавальний засіб дає змогу користувачу постачати в певному порядку символи, описані у розділі 6 і прийнятні, щоб передавати їхнє кодоване подання у КС-елементі даних.
Приймальний засіб здатний приймати й інтерпретувати кодоване подання символів, що складає частину КС-елемента даних і відповідає розділу 6, і може відповідні символи зробити доступними користувачу, щоб він міг розпізнати їх і відрізнити один від іншого.
НОРМАТИВНІ ПОСИЛАННЯ
Цей стандарт містить положення інших стандартів, які стали його невід’ємною частиною через посилання. На момент опублікування зазначені стандарти були чинні. Усі рекомендації й стандарти підлягають перегляду, тож учасники узгоджень, основаних на цій частині стандарту, мають застосовувати останню редакцію перелічених далі рекомендацій і стандартів. Члени I EC та ISO ведуть реєстри чинних на поточний момент міжнародних стандартів.
ISO/IEC 2022:1994 Information technology — Character code structure and extension techniques
ISO/IEC 4873:1991 Information technology — ISO 8-bit code for information interchange — Structure and rules for implementation
ISO/IEC 8824:1995 Information technology — Abstract Syntax Notation One (ASN1): Specification of basic notation.
НАЦІОНАЛЬНЕ ПОЯСНЕННЯ
ISO/IEC 2022:1994 Інформаційні технології. Структура символьних кодів і техніка розширення
ISO/IEC 4873:1991 Інформаційні технології. Восьмибітний код ISO для обміну інформацією. Структура і правила реалізації
ISO/IEC 8824:1995 Інформаційні технології. Нотація-1 абстрактного синтаксису (ASN.1): Специфікація базової нотації.
ТЕРМІНИ ТА ВИЗНАЧЕННЯ ПОНЯТЬ
У цій частині стандарту використано такі поняття.
бітова комбінація (bit combination)
Упорядкований набір бітів, використовуваних для подання символів
байт (byte)
Рядок бітів, розглядуваних як єдине ціле
символ (character)
Член набору елементів, використовуваних для організації, контролю або подання даних
кодова таблиця (code table)
Таблиця, що подає символи, розміщені у коді згідно з їхньою бітовою комбінацією
набір кодованих символів, код (coded character set, code)
Набір точно сформульованих правил, за якими встановлюють набір символів І взаємно однозначну відповідність між символами з набору та їхньою бітовою комбінацієюкодовано-символьний елемент даних (CC-data-elemenf)
Елемент обміну інформацією, складений із послідовності кодів символів згідно з одним або кількома стандартами для наборів кодованих символів
графічний символ (graphic character)
Символ, який відрізняють від функції керування, має візуальне подання, зазвичай рукописне, друковане чи виведене на екран, має кодоване подання, складене з однієї або кількох бітових комбінацій.
Примітка. У цій частині стандарту однобайтні комбінації використовують для подання кожного символу
графічний знак (graphic symbol)
Візуальне подання графічного символу або функції керування
позиція (position)
Частина кодової таблиці, обумовлена координатами по вертикалі і горизонталі.
НОТАЦІЯ, КОДОВА ТАБЛИЦЯ ТА ІМЕНА
Нотація
Біти бітової комбінації восьмибітного коду визначають Ь8, Ь7, Ь6, Ь5, Ь4, ЬЗ, Ь2 та Ы, де Ь8 — найстарший за порядком біт або найзначущий біт, а М - наймолодший за порядком біт, найменш значущий біт.
Бітову комбінацію можна інтерпретувати, подаючи числа у двійковій системі числення, приписуючи кожному біту таку вагу:
Біт |
Ь8 |
Ь7 |
Ь6 |
Ь5 |
Ь4 |
ЬЗ |
Ь2 |
Ы |
Вага |
128 |
64 |
32 |
16 |
8 |
4 |
2 |
1 |
Використовуючи ці ваги, бітові комбінації ідентифікують у нотації за формою хх/уу, де хх і уу — числа з інтервалу від 0 до 15. Відповідність між нотацією у формі хх/уу І комбінацією, складеною з бітів від Ь8 до Ы, полягає в такому:
хх є число, позначене Ь8, Ь7, Ь6 і Ь5, де ці біти подано вагами 8, 4, 2,1 відповідно;
уу є число, позначене Ь4, ЬЗ, Ь2 і Ы, де ці біти подано вагами 8, 4, 2,1 відповідно.
Бітові комбінації також ідентифікують за нотацією у формі hk, де h і к — числа в діапазоні від 0 до F у шістнадцятковій системі числення. Число h позначено хх, а число к — уу,
Формат кодової таблиці
Восьмибітну кодову таблицю складено з 256 позицій, розташованих у 16 рядках і 16 стовпчиках. Рядки і стовпчики пронумеровано від 0 до 15. У шістнадцятковій системі числення стовпчики і рядки пронумеровано від 0 до F.
Позиції кодової таблиці ідентифікують за нотацією у формі хх/уу, де хх — номер стовпчика, а уу — номер рядка. Номери стовпчиків і рядків показано відповідно у лівому крайньому стовпчику і нагорі таблиці. Позиції кодової таблиці також ідентифікують за нотацією у формі /ік, де h — номер стовпчика, а к — номер рядка в шістнадцятковій системі числення. Номери стовпчиків і рядків зазначено знизу й у правому крайньому стовпчику таблиці.
Позиції кодової таблиці взаємно однозначно відповідають бітовим комбінаціям коду. Нотація позиції кодової таблиці за формою хх/уу чи за формою hk є те саме, що й відповідна бітова комбінація.
Імена і значення
У цьому стандарті кожному графічному символу надано власне ім'я й унікальний Ідентифікатор. Ці Імена й Ідентифікатори взято з ISO/IEC 10646. Цей стандарт встановлює акронім для кожного із символів пробілу (SP), нерозривного пробілу— NO-BREAK SPACE (NBSP), м’якого переносу SOFT HYPHEN (SHY). Для акронімів використовують тільки великі літери латиниці від А до Z. Акроніми вживають у всіх перекладах тексту.
Крім пробілу, NBSP і SHY, у цьому стандарті не наведено визначення і не обмежено значення графічних символів.
У цьому стандарті зазначено графічний знак для кожного графічного символу. Цей знак уведено у відповідну позицію кодової таблиці. Проте у цьому стандарті не встановлено конкретний стиль або ескіз шрифту для подання графічних символів. У додатку ISO/IEC 10367 наведено Інформацію з цієї теми
.Пробіл (SP) — графічний символ, візуальне подання якого полягає у відсутності графічно го знака.
Нерозривний пробіл (NBSP) — графічний символ, візуальне подання якого — відсутніст графічного знака; використовують, якщо у тексті треба уникнути розриву рядків.
М'який переніс (SHY) — графічний символ, зображуваний як графічний знак, подібний д, переносу, використовують, коли рядок розірвано на конкретному слові.
СПЕЦИФІКАЦІЯ НАБОРУ ГРАФІЧНИХ СИМВОЛІВ ЛАТИНИЦІ/КИРИЛИЦІ
У цьому стандарті описано 191 символ, розміщений згідно з бітовою комбінацією кодовоїтаблиі (таблиця 2). Жоден Із цих символів не є комбінованим.
Примітка. Комбіновані символи описано в 6.3.3 стандарту ISO/IEC 2022.
Такі функції керування, як BACKSPACE або CARRIAGE RETURN, не використовують для створенн комбінованих графічних знаків, утворених із графічного подання двох чи більше символів.
Набір символів та їхнє графічне подання
Див. таблицю 1.
Таблиця 1 — Кодоване подання набору символів латиниці/кирилиці
Бітова комбінація |
Шістнадця- тковий код |
Ідентифікатор |
Символьне ім'я |
Український переклад імені |
02/00 |
20 |
U+0020 |
SPACE |
Пробіл (SP) |
02/01 |
21 |
U+0021 |
EXCLAMATION MARK |
Знак оклику! |
02/02 |
22 |
U+0022 |
QUOTATION MARK |
Лапки" |
02/03 |
23 |
U+0023 |
NUMBER SIGN |
Знак числа # |
02/04 |
24 |
U+0024 |
DOLLAR SIGN |
Знак долара $ |
02/05 |
25 |
U+0025 |
PERCENT SIGN |
Знак відсотка % |
02/06 |
26 |
U+0026 |
AMPERSAND |
Амперсанд & |
02/07 |
27 |
U+0027 |
APOSTROPHE |
Апостроф ’ |
02/08 |
28 |
U+0028 |
LEFT PARENTHESIS |
Ліва кругла дужка ( |
02/09 |
29 |
U+0029 |
RIGHT PARENTHESIS |
Права кругла дужка) |
02/10 |
2А |
U+002A |
ASTERISK |
Зірочка * |
02/11 |
2В |
U+002B |
PLUS SIGN |
Плюс + |
02/12 |
2С |
U+002C |
COMMA |
Кома, |
02/13 |
2D |
U+002D |
HYPHEN-MINUS |
Дефіс-мінус - |
02/14 |
2Е |
U+002E |
FULL STOP |
Крапка . |
02/15 |
2F |
U+002F |
SOLIDUS |
Дробова риска / |
03/00 |
ЗО |
U+0030 |
DIGIT ZERO |
Цифра нуль |
03/01 |
31 |
U+0031 |
DIGIT ONE |
Цифра один |
03/02 |
32 |
U+0032 |
DIGIT TWO |
Цифра два |
03/03 |
33 |
U+0033 |
DIGIT THREE |
Цифра три |
03/04 |
34 |
U+0034 |
DIGIT FOUR |
Цифра чотири |
03/05 |
35 |
U+0035 |
DIGIT FIVE |
Цифра п’ять |
03/06 |
36 |
U+0036 |
DIGIT SIX |
Цифра шість |
03/07 |
37 |
U+0037 |
DIGIT SEVEN |
Цифра сім |
03/08 |
38 |
U+0038 |
DIGIT EIGHT |
Цифра вісім |
03/09 |
39 |
U+0039 |
DIGIT NINE |
Цифра дев’ять |
03/10 |
ЗА |
U+003A |
COLON |
Двокрапка: |
03/11 |
ЗВ |
U+003B |
SEMICOLON |
Крапка з комою ; |
03/12 |
зс |
U+003C |
LESS-THAN SIGN |
Знак «менше» < |
03/13 |
3D |
U+003D |
EQUALS SIGN |
Знак «дорівнює» = |