ГОСУДАРСТВЕННЫЙ СТАНДАРТ
СОЮЗА ССР
СИСТЕМЫ ОБРАБОТКИ ИНФОРМАЦИИ
НАБОРЫ СИМВОЛОВ
В 7-И 8-БИТНЫХ КОДАХ
МЕТОДЫ РАСШИРЕНИЯ КОДОВ
( СТ СЭВ 360-86 )
И
Цена 15 коп.
ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР ПО СТАНДАРТАМ
Москва
УДК 631.3.04:006.354 Группа П85
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР
Системы обработки информации
Н
ГОСТ
27466-87
(СТ СЭВ 360-86)
Методы расширения кодов
Information processing systems.
7-bit and 8-bit coded character sets.
Code extension techniques
ОКСТУ 4002
Дата введения 01.01.88
Настоящий стандарт распространяется на электронные вычислительные машины, средства ввода и вывода, подготовки, телеобработки и передачи данных, терминальные системы, программное обеспечение и средства систем обработки данных и устанавливает методы расширения 7- и 8-битных совместимых кодов, структуры расширяемых 7- и 8-битных кодов и взаимосвязь между 7- и 8-битными кодами, а также классификацию методов расширения кода и структуру определенных классов.
ОСНОВНЫЕ ПОЛОЖЕНИЯ
Структура, наименование, определение и обозначение символов и кодовых позиций 7-битных кодов по ГОСТ 27463—87 и 8-битных кодов по ГОСТ 19768-74.
Цель расширения кода
Приведенный в ГОСТ 27463—87 7-битный код и в ГОСТ 19768—74 8-битный код позволяют представить наборы до 128 идо 256 символов соответственно. ГОСТ 27463—87 и ГОСТ 19768—74 позволяют представлять другие графические символы при помощи сочетания двух или более графических символов с управляющими символами ВОЗВРАТ НА ШАГ или ВОЗВРАТ КАРЕТКИ. Если наборы символов по ГОСТ 27463—87 или ГОСТ 19768—74 не содержат достаточного количества управляющих функций или графических символов, то эти требования могут быть удовлетворены при помощи методов расширения, установленных настоящим стандартом.
Издание официальное Перепечатка воспрещена
© Издательство стандартов, 1988Правила, установленные в настоящем стандарте, могут быть использованы также для создания добавочных средств расширения кода, например, при формировании некоторых параметрических управляющих функций. В настоящем стандарте эти добавочные средства не описываются.
Расширяемые структуры кодов
Используя базисные структуры кодов, приведенные в ГОСТ 27463—87 и ГОСТ 19768—74, настоящий стандарт устанавливает различные средства расширения наборов управляющих функций и наборов графических символов кода, а также структуры и методы построения и формирования расширенных кодов, связанных с 7 - и 8-битным кодами, а именно:
расширение 7-битного кода, остающееся в 7-битной среде;
структуру семейства 8-битных кодов, остающихся совместимыми с 7-битной структурой;
расширение 8-битного кода, остающееся в 8-битной среде;
связь между 7- и 8-битными кодами.
Преимущества идентичности методов расширения кода
С целью обеспечения идентичности методов расширения кода во всех вышеприведенных случаях и для облегчения их преобразования следует применять стандартные правила расширения кода. Это позволяет:
уменьшить вероятность противоречия между взаимодействующими системами;
обеспечить условия для расширения кода при проектировании систем;
предоставить стандартизованные методы вызова согласованных наборов символов;
обеспечить обмен данными между 7- и 8-битной средами и т.д.
Вид обрабатываемых данных
Методы расширения кода предназначены для применения при последовательной обработке данных в прямом направлении. Применение этих методов к данным, обрабатываемым иначе, или к форматизованным данным для обработки записей фиксированной длины может привести к нежелательным результатам или потребовать дополнительной специальной обработки с целью обеспечения правильной интерпретации.
Условия соблюдения требований'к методам расширения кода
Настоящий стандарт включает множество возможностей расширения кода. В отдельных устройствах, средствах или системах можно использовать выбор из этих возможностей. Документация по устройствам, средствам и системам должна специфицировать подмножество выбранных возможностей методов расширения кода. Использованное подмножество методов расширения кода соответствует настоящему стандарту при выполнении следующих требований:методы расширения кодов, описанные в настоящем стандарте, следует выполнять при помощи управляющих функций, установленных в настоящем стандарте, с принятыми для них обозначениями и кодовыми представлениями;
не следует применять кодированные представления, зарезервированные для будущей регистрации и стандартизации, значение которых необъяв- лено;
не следует применять никакие последовательности АР2 со значениями, отличными от зарегистрированных;
если требуется, чтобы две системы с различными подмножествами выбранных методов расширения кода осуществляли связь друг с другом, то для этой связи используют только общие методы расширения кода.
Понятия и пояснения приведены в приложении 3.
Комбинации битов, предназначенные для присвоения определенным наборам символов или определенным управляющим функциям для их вызова или обозначения, используют в соответствии с процедурами регистрации, сведения о которых приведены в приложении 4.
ФОРМЫ ЗАПИСИ
В настоящем стандарте в соответствии с ГОСТ 27463-87 и ГОСТ 19768—74 используют обозначения позиций кодовых таблиц, приведенные в приложении 5.
РАСШИРЕНИЕ 7-БИТНОГО КОДА В 7-БИТНОЙ СРЕДЕ
Введение
Структура 7-битного кода
7-битная кодовая таблица по ГОСТ 27463—87, приведенная в приложении 6, служит основой для методов расширения кода,применяемых к наборам символов в 7-битном коде.
Расширение заменой
Если требования ГОСТ 27463—87 не соответствуют требованиям какого-то применения, то эти требования могут быть удовлетворены при помощи использования подобным же образом структурированного кода, в котором некоторые из символов по ГОСТ 27463-87 заменены другими символами. Замену следует рассматривать, как создание нового кода, не установленного ГОСТ 27463-87.
Расширение увеличением состава символов
Настоящий стандарт позволяет увеличить состав символов, дополнительных по отношению к 128 символам, предусмотренным структурой 7-битного кода по ГОСТ 27463—87, следующими способами:
дополнительными единичными управляющими функциями;
дополнительными наборами из 32 управляющих функций;
дополнительными наборами из 94 графических символов;
дополнительными наборами из 96 графических символов;
дополнительными наборами из более чем 94 или 96 графических символов, каждый из которых представлен более чем одним байтом, т.е. многобайтными наборами.
Дополнительные наборы символов, приведенные выше в перечислениях 3) - 5), не должны содержать ПРОБЕЛ и управляющие символы, включая ЗАБОЙ.
Элементы расширения кода
Конкретные применения требуют комбинаций вышеприведенных средств расширения кода. Элементы расширения кода показаны на черт. 1, где наименования элементов определены следующим образом:
Набор
СО
Набор
ГО
Набор
С1
Элементы расширения кола
Дополнительные единичные управляющие функции
Черт. 1
набор СО — набор, состоящий из 32 управляющих символов (столбцы 0 и 1) ;
набор С1 — дополнительный набор, состоящий из 32 управляющих функций;
дополнительные единичные управляющие символы;
набор ГО — набор, состоящий из 94 графических символов (комбинации битов с 2/1 по 7/14) ; многобайтный набор может также использоваться как набор ГО.
Вместо русской прописной буквы Г допускается наборы графических символов обозначать латинской буквой G ;
наборы Г1, Г2, ГЗ — дополнительные наборы, состоящие из 94 графических символов (комбинации битов с 2/1 по 7/14) или из 96 графических символов (комбинации битов 2/0 по 7/15) ; многобайтные наборы могут использоваться как наборы Г1, Г2 или ГЗ.
Наборы управляющих и графических символов, которые совместимы с ГОСТ 27463—87, рекомендуется использовать как наборы СО и ГО соответственно.
Совместимость
Для обмена устанавливают различные уровни совместимости, которые могут сохраняться при применении средств расширения. Выделяют три уровня:
версия в соответствии с ГОСТ 27463—87;
вариант 7-битного кода, который является совместимым с ГОСТ 27463—87 с учетом следующих требований;
столбцы 0 и 1 содержат только управляющие символы;
десять управляющих символов связи и ПУС, ВЫХ, ВХ, АН, ЗМ, АР2, ПР и ЗБ сохраняют свои значения и позиции в кодовой таблице;
ПРОБЕЛ, ЗАБОЙ и один или два набора из 94 графических символов размещаются в столбцах со 2-го по 7-й; наборы из 96 графических символов, многобайтные наборы и функции переключения, иные чем ВХ и ВЫХ, не используются;
графические символы по ГОСТ 27463—87 не смещаются на другие позиции (это требование не распространяется на нелатинский алфавит, содержащий графические символы, которые входят также в латинский алфавит;
другие 7-битные коды, структурированные по п. 3.1.1, которые могут содержать 94 графических символа, 96 графических символов и (или) многобайтные наборы в столбцах со 2-го по 7-й. С целью обеспечения возможностей расширения кода, описанных в настоящем стандарте, значения и позиции символов АВТОРЕГИСТР ДВА, ВЫХОД и ВХОД в кодовой таблице должны оставаться неизменными.
Символы расширения кода по ГОСТ 27463—87. В ГОСТ 27463—87 приведены следующие управляющие символы основного набора СО, предназначенные для целей расширения кода АВТОРЕГИСТР ДВА (АР2), ВЫХОД (ВЫХ). ВХОД (ВХ) и АВТОРЕГИСТР ОДИН (API). Их определение приведено в ГОСТ 27465—87.
Настоящий стандарт не определяет использование управляющего символа АВТОРЕГИСТР ОДИН, который зарезервирован для обеспечения дополнительных управляющих функций связи.
Другие символы расширения кода
В ГОСТ 27465—87, кроме символов, перечисленных в п. 3.1.6 настоящего стандарта, приведены для использования в7-битной среде следующие, дополнительные управляющие функции переключения: ПЕРЕКЛЮЧАТЕЛЬ ДВА (П2), ПЕРЕКЛЮЧАТЕЛЬ ТРИ (ПЗ), ПЕРЕКЛЮЧАТЕЛЬ ЕДИНИЧНЫЙ ДВА (ПЕ2), ПЕРЕКЛЮЧАТЕЛЬ ЕДИНИЧНЫЙ ТРИ (ПЕЗ).
Способы кодирования управляющих функций указаны в приложении!.
Дополнительные управляющие функции, предназначенные для использования в 8-битной среде, ПЕРЕКЛЮЧАТЕЛЬ ВПРАВО ОДИН (ПП1), ПЕРЕКЛЮЧАТЕЛЬ ВПРАВО ДВА (ПП2), ПЕРЕКЛЮЧАТЕЛЬ ВПРАВО ТРИ (ППЗ) (см. п. 5.2,1) используются в 7-битной среде только для преобразования данных из 7-битной в 8-битную среду и обратно (см. пп. 7.2 и 7.4). Воздействие управляющих функций ПП1, ПП2 и ППЗ в 7-битном коде отвечает воздействию управляющих функций ВЫХ, П2 и ПЗ соответственно.
Комбинация графических символов
Для наборов графических символов, обеспечивающих представление дополнительных графических символов, таких как, например, символы с диакритическими знаками, при помощи комбинации двух или более графических символов в одной и той же позиции символа, предусматривают два метода комбинации графических символов в одной символьной позиции:
графические символы, включающие в себя прямое движение (интервальные символы), используются вместе с символом ВОЗВРАТ НА ШАГ или ВОЗВРАТ КАРЕТКИ;
графические символы, не осуществляющие прямое движение (неинтервальные символы), используются в комбинации с интервальными графическими символами.
ГОСТ 27463—87 допускает использование первого из этих двух методов для представления символов с диакритическими знаками (1 или 2-й уровни совместимости по п. 3.1.5). Второй метод предназначается для 3-го уровня совместимости. Составителю графических наборов, который требует регистрации (см. приложение 4), следует идентифицировать все символы в наборе, которые не являются интервальными.
Новые стандарты, определяющие набор символов, должны содержать ограничение в комбинировании символов, если это не установлено при регистрации этого набора.
Расширение графического набора при помощи функций переключения
Функциями переключения, определенными в ГОСТ 27465-87 для использования в 7-битной среде, являются: ВЫХ, ВХ, П2, ПЗ, ПЕЗ, ПЕ2.
Использование функций блокирующего переключения
В 7-битной среде функции ВЫХОД (ВЫХ), ВХОД (ВХ), ПЕРЕКЛЮЧАТЕЛЬ ДВА (П2) и ПЕРЕКЛЮЧАТЕЛЬ ТРИ (ПЗ) следует использовать исключительно для расширения графического набора.
Каждая из функций переключения ВЫХ, П2 или ПЗ вызывает дополнительный набор из 94 или 96 графических символов: Г1, Г2 и ГЗ соответственно. Набор, содержащий 94 символа, вызывается в позиции с 2/1 по 7/14, ПРОБЕЛ в позицию 2/0 и ЗАБОЙ в позицию 7/15; набор, содержащий 96 символов, вызывается в позиции с 2/0 по 7/15. Допускается некоторым позициям дополнительных наборов не приписывать графические символы. Не требуется, за исключением случаев, описанных ниже, чтобы все графические символы дополнительного набора отличались от графических символов ранее вызванного набора.