відкритих систем згідно з ДСТУ 4249:2003. Йдеться про організацію трьох видів інтерфейсу (мереж­ного, АРІ І людина-комп'ютер) одиницями обміну, тобто файлами лише у стандартному кодуванні за таблицями UCS-4 та (JCS-2 (Unicode, UTF-8), ДСТУ 4353-5, СР1251 та KOI8-Unified, з обов’язковим наданням користувачеві права вибору способу кодування файлу з однієї з цих таблиць. Усі інші ко­дування, так само як і нові, що випливають зі специфіки алгоритмів застосувань, треба вважати вну­трішніми і, можливо, складовими ноу-хау фірми-розробника застосування.ДСТУ 4353-5:2004

НАЦІОНАЛЬНИЙ СТАНДАРТ УКРАЇНИ

ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ

ВОСЬМ И БІТИ І ОДНОБАЙТНІ НАБОРИ
КОДОВАНИХ ГРАФІЧНИХ СИМВОЛІВ

Частина 5. Латиниця/кирилиця

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

ВОСЬМИБИТНЫЕ ОДНОБАЙТНЫЕ НАБОРЫ
КОДИРОВАННЫХ ГРАФИЧЕСКИХ СИМВОЛОВ

Часть 5. Лати ни ца/ки рилли ца

INFORMATION TECHNOLOGY

8-BIT SINGLE-BYTE CODED

GRAPHIC CHARACTER SETS

Part 5: Latin/Cyrillic alphabet

Чинний з 2006-04-01

  1. СФЕРА ЗАСТОСУВАННЯ

У цьому стандарті визначено набір із 191 кодованого графічного символу, що відповідає об’єднан­ню абеток латиниці/кирилиці. Цей набір призначено для використання в обробленні текстів і даних, а також в обміні Інформацією.

Набір складено з графічних символів, переважно використовуваних у цільових застосуваннях зви­чайних офісних систем, що працюють принаймні з такими мовами: болгарська, білоруська, англійська, латинська, македонська (слов’янська), російська, сербська, українська.

Примітка. Дві літери, нещодавно додані до офіційної української абетки, не включено у набір символів цього стан­дарту. З цього питання підготовлено звіт CEN/CENELEC/PT004 (див. Бібліографію).

Цей набір кодованих графічних символів можна розглядати як версію восьмибітного коду згідно з ISO/IEC 2022 або ISO/IEC 4873 на рівні 1.

Стандарт можна використовувати як сполучну ланку з усіма іншими частинами ISO/IEC 8859. Якщо спільно застосовують кодовані символи більше, ніж з однієї частини, використовуючи методи розши­рення коду, то еквівалентний набір кодованих символів з ISO/IEC 10367 треба використовувати замість версії ISO/IEC 4873 на рівні 2 чи 3.

Кодовані символи з цього набору можна використовувати у поєднанні з кодованими функціями керування, обраними згідно з ISO/IEC 6429. Однак функції керування не використовують для створення складених графічних знаків із двох чи більше графічних символів (розділ 6).

Примітка. Цей стандарт не призначено для використання службами телематики, визначеними ITU-T. Якщо Інфор­мацію, закодовану згідно з ISO/IEC 8859, перекладають для таких служб, вона має відповідати технічним вимогам цих служб.

Видання офіційне

  1. ВІДПОВІДНІСТЬ СТАНДАРТУ

    1. Відповідність обміну Інформацією

Кодоваяо-символьний елемент даних (КС-елемент — CC-data-efement) всередині закодованої інформації, призначеної для обміну, узгоджено з цим стандартом, якщо всі кодовані подання графіч­них символів всередині цього КС-елемента даних відповідають технічним вимогам розділу 6.

  1. Узгодження засобів

Засіб узгоджено з цією частиною стандарту, якщо він відповідає технічним вимогам 2.2.1 та од­ночасно або окремо вимогам 2.2.2 та 2.2.3. Згідно з вимогою відповідності розпізнають документ, що містить опис, специфікований у 2.2.1.

    1. Опис засобів. Засіб, який відповідає цій частині стандарту, може бути об’єктом опису, що Ідентифікує значення, за яким користувач може вводити символи у засіб або розпізнавати їх, якщо вони стають доступними, як визначено у технічних вимогах 2.2.2 та 2.2.3.

    2. Передавальний засіб дає змогу користувачу постачати в певному порядку символи, опи­сані у розділі 6 і прийнятні, щоб передавати їхнє кодоване подання у КС-елементі даних.

    3. Приймальний засіб здатний приймати й інтерпретувати кодоване подання символів, що складає частину КС-елемента даних і відповідає розділу 6, і може відповідні символи зробити доступ­ними користувачу, щоб він міг розпізнати їх і відрізнити один від іншого.

  1. НОРМАТИВНІ ПОСИЛАННЯ

Цей стандарт містить положення інших стандартів, які стали його невід’ємною частиною через посилання. На момент опублікування зазначені стандарти були чинні. Усі рекомендації й стандарти підлягають перегляду, тож учасники узгоджень, основаних на цій частині стандарту, мають застосову­вати останню редакцію перелічених далі рекомендацій і стандартів. Члени I EC та ISO ведуть реєст­ри чинних на поточний момент міжнародних стандартів.

ISO/IEC 2022:1994 Information technology — Character code structure and extension techniques

ISO/IEC 4873:1991 Information technology — ISO 8-bit code for information interchange — Structure and rules for implementation

ISO/IEC 8824:1995 Information technology — Abstract Syntax Notation One (ASN1): Specification of basic notation.

НАЦІОНАЛЬНЕ ПОЯСНЕННЯ

ISO/IEC 2022:1994 Інформаційні технології. Структура символьних кодів і техніка розширення

ISO/IEC 4873:1991 Інформаційні технології. Восьмибітний код ISO для обміну інформацією. Струк­тура і правила реалізації

ISO/IEC 8824:1995 Інформаційні технології. Нотація-1 абстрактного синтаксису (ASN.1): Специфі­кація базової нотації.

  1. ТЕРМІНИ ТА ВИЗНАЧЕННЯ ПОНЯТЬ

У цій частині стандарту використано такі поняття.

  1. бітова комбінація (bit combination)

Упорядкований набір бітів, використовуваних для подання символів

  1. байт (byte)

Рядок бітів, розглядуваних як єдине ціле

  1. символ (character)

Член набору елементів, використовуваних для організації, контролю або подання даних

  1. кодова таблиця (code table)

Таблиця, що подає символи, розміщені у коді згідно з їхньою бітовою комбінацією

  1. набір кодованих символів, код (coded character set, code)

  1. Набір точно сформульованих правил, за якими встановлюють набір символів І взаємно однозначну відповідність між символами з набору та їхньою бітовою комбінацієюкодовано-символьний елемент даних (CC-data-elemenf)

Елемент обміну інформацією, складений із послідовності кодів символів згідно з одним або кілько­ма стандартами для наборів кодованих символів

  1. графічний символ (graphic character)

Символ, який відрізняють від функції керування, має візуальне подання, зазвичай рукописне, дру­коване чи виведене на екран, має кодоване подання, складене з однієї або кількох бітових комбінацій.

Примітка. У цій частині стандарту однобайтні комбінації використовують для подання кожного символу

  1. графічний знак (graphic symbol)

Візуальне подання графічного символу або функції керування

  1. позиція (position)

Частина кодової таблиці, обумовлена координатами по вертикалі і горизонталі.

  1. НОТАЦІЯ, КОДОВА ТАБЛИЦЯ ТА ІМЕНА

    1. Нотація

Біти бітової комбінації восьмибітного коду визначають Ь8, Ь7, Ь6, Ь5, Ь4, ЬЗ, Ь2 та Ы, де Ь8 — най­старший за порядком біт або найзначущий біт, а М - наймолодший за порядком біт, найменш значу­щий біт.

Бітову комбінацію можна інтерпретувати, подаючи числа у двійковій системі числення, припису­ючи кожному біту таку вагу:

Біт

Ь8

Ь7

Ь6

Ь5

Ь4

ЬЗ

Ь2

Ы

Вага

128

64

32

16

8

4

2

1



Використовуючи ці ваги, бітові комбінації ідентифікують у нотації за формою хх/уу, де хх і уу — числа з інтервалу від 0 до 15. Відповідність між нотацією у формі хх/уу І комбінацією, складеною з бітів від Ь8 до Ы, полягає в такому:

  • хх є число, позначене Ь8, Ь7, Ь6 і Ь5, де ці біти подано вагами 8, 4, 2,1 відповідно;

  • уу є число, позначене Ь4, ЬЗ, Ь2 і Ы, де ці біти подано вагами 8, 4, 2,1 відповідно.

Бітові комбінації також ідентифікують за нотацією у формі hk, де h і к — числа в діапазоні від 0 до F у шістнадцятковій системі числення. Число h позначено хх, а число к — уу,

  1. Формат кодової таблиці

Восьмибітну кодову таблицю складено з 256 позицій, розташованих у 16 рядках і 16 стовпчиках. Рядки і стовпчики пронумеровано від 0 до 15. У шістнадцятковій системі числення стовпчики і рядки пронумеровано від 0 до F.

Позиції кодової таблиці ідентифікують за нотацією у формі хх/уу, де хх — номер стовпчика, а уу — номер рядка. Номери стовпчиків і рядків показано відповідно у лівому крайньому стовпчику і нагорі таблиці. Позиції кодової таблиці також ідентифікують за нотацією у формі /ік, де h номер стовпчи­ка, а к — номер рядка в шістнадцятковій системі числення. Номери стовпчиків і рядків зазначено знизу й у правому крайньому стовпчику таблиці.

Позиції кодової таблиці взаємно однозначно відповідають бітовим комбінаціям коду. Нотація по­зиції кодової таблиці за формою хх/уу чи за формою hk є те саме, що й відповідна бітова комбінація.

  1. Імена і значення

У цьому стандарті кожному графічному символу надано власне ім'я й унікальний Ідентифікатор. Ці Імена й Ідентифікатори взято з ISO/IEC 10646. Цей стандарт встановлює акронім для кожного із сим­волів пробілу (SP), нерозривного пробілу— NO-BREAK SPACE (NBSP), м’якого переносу SOFT HYPHEN (SHY). Для акронімів використовують тільки великі літери латиниці від А до Z. Акроніми вживають у всіх перекладах тексту.

Крім пробілу, NBSP і SHY, у цьому стандарті не наведено визначення і не обмежено значення гра­фічних символів.

У цьому стандарті зазначено графічний знак для кожного графічного символу. Цей знак уведено у відповідну позицію кодової таблиці. Проте у цьому стандарті не встановлено конкретний стиль або ескіз шрифту для подання графічних символів. У додатку ISO/IEC 10367 наведено Інформацію з цієї теми

    1. .Пробіл (SP) — графічний символ, візуальне подання якого полягає у відсутності графічно го знака.

    2. Нерозривний пробіл (NBSP) — графічний символ, візуальне подання якого — відсутніст графічного знака; використовують, якщо у тексті треба уникнути розриву рядків.

    3. М'який переніс (SHY) — графічний символ, зображуваний як графічний знак, подібний д, переносу, використовують, коли рядок розірвано на конкретному слові.

  1. СПЕЦИФІКАЦІЯ НАБОРУ ГРАФІЧНИХ СИМВОЛІВ ЛАТИНИЦІ/КИРИЛИЦІ

У цьому стандарті описано 191 символ, розміщений згідно з бітовою комбінацією кодовоїтаблиі (таблиця 2). Жоден Із цих символів не є комбінованим.

Примітка. Комбіновані символи описано в 6.3.3 стандарту ISO/IEC 2022.

Такі функції керування, як BACKSPACE або CARRIAGE RETURN, не використовують для створенн комбінованих графічних знаків, утворених із графічного подання двох чи більше символів.

  1. Набір символів та їхнє графічне подання

Див. таблицю 1.

Таблиця 1 — Кодоване подання набору символів латиниці/кирилиці

Бітова комбінація

Шістнадця- тковий код

Ідентифікатор

Символьне ім'я

Український переклад імені

02/00

20

U+0020

SPACE

Пробіл (SP)

02/01

21

U+0021

EXCLAMATION MARK

Знак оклику!

02/02

22

U+0022

QUOTATION MARK

Лапки"

02/03

23

U+0023

NUMBER SIGN

Знак числа #

02/04

24

U+0024

DOLLAR SIGN

Знак долара $

02/05

25

U+0025

PERCENT SIGN

Знак відсотка %

02/06

26

U+0026

AMPERSAND

Амперсанд &

02/07

27

U+0027

APOSTROPHE

Апостроф ’

02/08

28

U+0028

LEFT PARENTHESIS

Ліва кругла дужка (

02/09

29

U+0029

RIGHT PARENTHESIS

Права кругла дужка)

02/10

U+002A

ASTERISK

Зірочка *

02/11

U+002B

PLUS SIGN

Плюс +

02/12

U+002C

COMMA

Кома,

02/13

2D

U+002D

HYPHEN-MINUS

Дефіс-мінус -

02/14

U+002E

FULL STOP

Крапка .

02/15

2F

U+002F

SOLIDUS

Дробова риска /

03/00

ЗО

U+0030

DIGIT ZERO

Цифра нуль

03/01

31

U+0031

DIGIT ONE

Цифра один

03/02

32

U+0032

DIGIT TWO

Цифра два

03/03

33

U+0033

DIGIT THREE

Цифра три

03/04

34

U+0034

DIGIT FOUR

Цифра чотири

03/05

35

U+0035

DIGIT FIVE

Цифра п’ять

03/06

36

U+0036

DIGIT SIX

Цифра шість

03/07

37

U+0037

DIGIT SEVEN

Цифра сім

03/08

38

U+0038

DIGIT EIGHT

Цифра вісім

03/09

39

U+0039

DIGIT NINE

Цифра дев’ять

03/10

ЗА

U+003A

COLON

Двокрапка:

03/11

ЗВ

U+003B

SEMICOLON

Крапка з комою ;

03/12

зс

U+003C

LESS-THAN SIGN

Знак «менше» <

03/13

3D

U+003D

EQUALS SIGN

Знак «дорівнює» =