ГОСУДАРСТВЕННЫЙ СТАНДАРТ
СОЮЗА ССР

СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ, БИБЛИОТЕЧНОМУ
И ИЗДАТЕЛЬСКОМУ ДЕЛУ

КОММУНИКАТИВНЫЙ ФОРМАТ
ДЛЯ СЛОВАРЕЙ ИНФОРМАЦИОННЫХ
ЯЗЫКОВ И ТЕРМИНОЛОГИЧЕСКИХ
ДАННЫХ

СОДЕРЖАНИЕ ЗАПИСИ

ГОСТ 7.47-84

И

Цена 10 коп.


здание официальное

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР ПО СТАНДАРТАМ
Москва

ГОСУДАРСТВЕННЫЙ СТАНДАРТ
СОЮЗА ССР

СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ, БИБЛИОТЕЧНОМУ
И ИЗДАТЕЛЬСКОМУ ДЕЛУ

КОММУНИКАТИВНЫЙ ФОРМАТ
ДЛЯ СЛОВАРЕЙ ИНФОРМАЦИОННЫХ
ЯЗЫКОВ И ТЕРМИНОЛОГИЧЕСКИХ
ДАННЫХ

СОДЕРЖАНИЕ ЗАПИСИ

ГОСТ 7.47-84

Издание официальное

МОСКВА-1 984РАЗРАБОТАН

Государственным комитетом СССР по стандартам Государственным комитетом СССР по науке и технике Академией наук СССР

Государственным комитетом СССР по делам изобретений и откры­тий

Министерством авиационной промышленности

Министерством судостроительной промышленности ИСПОЛНИТЕЛИ

В. И. Федосимов, Г. Г. Белоногов, А. В. Веселовский, Ю. В. Сипапин, А. А. Полтев, Л. Ю. Герасимов, Э. П. Зарубин (руководители темы), В. А. Гарбарчик, В. Н. Белоозеров, Л. П. Веряскина, Н. Д. Кравченко, Е. Н. Казаков, В. С. Горбаченко, А. Б. Антопольский, Ю. Ф. Протопопов, Ю. П. Венедиктов

ВНЕСЕН Государственным комитетом СССР по стандартам

Зам. председателя В. И. Киларенко

УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Государствен­ного комитета СССР по стандартам от 28 февраля 1984 г. № 70

7

ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР

Система стандартов по информации, библиотечному и
издательскому делу

К

ГОСТ
7.47-84

ОММУНИКАТИВНЫЙ ФОРМАТ ДЛЯ СЛОВАРЕЙ
ИНФОРМАЦИОННЫХ ЯЗЫКОВ И
ТЕРМИНОЛОГИЧЕСКИХ ДАННЫХ

Содержание записи

System of standards on information, iibraries and
publishing. Communicative format for vocabularies of
information retrieval languages and terminological data.

Content of records

ОКСТУ OOOZ

Постановлением Государственного комитета СССР по стандартам от 28 февраля 1984 г. № 707 срок введения установлен

c 01.01.85

Настоящий стандарт устанавливает коммуникативный формат записи лексической информации на магнитной ленте, в том числе содержание записи, состав и идентификацию элементов данных.

Стандарт распространяется на представление на магнитной лен­те лексики словарей информационных языков, терминологических и других лексикографических источников для обмена между авто­матизированными информационными системами и обязателен для органов научно-технической информации.

Обозначение настоящего коммуникативного формата ФОЛИЯ — формат обмена лексикой информационных языков.

В части представления информационно-поисковых тезаурусов стандарт следует применять совместно с ГОСТ 7.25—80.

  1. ОБЩИЕ ПОЛОЖЕНИЯ

    1. Коммуникативный формат используют для записи на маг­нитной ленте информации из следующих лексикографических ис­точников:

одноязычные информационно-поисковые тезаурусы;

многоязычные информационно-поисковые тезаурусы;

рубрикаторы (классификации) научно-технической информации (включая УДК и Рубрикатор ГАСНТИ)

;списки (словари) предметных рубрик;

стандарты на термины и определения;

терминологические словари и справочники.

  1. Коммуникативный формат предназначен только для обме­на данными. Структура записей не ориентирована на информа­ционный поиск и не обязательна к применению в качестве внутренней структуры данных в конкретных информационных си­стемах.

  2. Лексикографический источник представляется в формате ФОЛИЯ последовательностью записей, каждая из которых соот­ветствует одной словарной статье источника. Основным элементом записи является заглавная лексическая единица (ЗЛЕ). Это эле­мент словника лексикографического источника, о котором в дан­ной словарной статье содержится дополнительная информация.

  3. Одна магнитная лента может содержать записи, относя­щиеся к одному и к нескольким источникам, причем каждый ис­точник может быть представлен полностью или частично.

Применяя записи различного типа, можно отразить на магнит­ной ленте систематическую классификацию лексических единиц, вставляя между записями с терминами записи с рубриками систе­матического указателя источника, а также представить источники, содержащие различные виды указателей лексических единиц.

    1. Для обеспечения синхронного ведения одинаковых или связанных источников в различных информационных системах в формате предусмотрены средства передачи изменений в лекси­ческом составе источника.

    2. Тип структуры данных, описываемых средствами коммуни­кативного формата — одноуровневое дерево с различными типами связей и возможностью группирования семантически связанных вершин. В каждой записи присутствует ЗЛЕ и другие элементы данных с указанием их роли или связи по отношению к ЗЛЕ с помощью меток элементов данных.

    3. Если в процессе развития лексических и терминологичес­ких систем возникает потребность в установлении новых видов се­мантических отношений и связей, не представленных в настоящем стандарте, их добавляют регистрацией в Автоматизированной сис­теме ведения информационных языков (АСВИЯ) ГАСНТИ.

  1. Кодирование данных в коммуникативном формате должно соответствовать требованиям СТ СЭВ 358—76 (таблица КОИ-8), кодирование расширенного списка символов — ГОСТ 7.28—80, ГОСТ 7.29—80, ГОСТ 7.30—80. Структура элементов данных, тре­бующих для своего представления расширения 8-битных кодов—■ по СТ СЭВ 360—76. Допускается применять код ДКОИ, если достаточно представления информации одними прописными буква­ми.СПОСОБ ПРЕДСТАВЛЕНИЯ ЛЕКСИКОГРАФИЧЕСКОЙ ИНФОРМАЦИИ

    1. Структура записи на магнитной ленте (МЛ) должна соответствовать требованиям ГОСТ 7.14—84.

Используют вариант структуры без индикаторов и идентифика­торов.

Для представления информации Макротезауруса ГАСНТИ допускается использовать варианты структуры с индикаторами и идентификаторами.

Применяют блокированные записи переменной длины с макси­мальной длиной блока 16000 байт.

  1. Значения компонентов маркера записи

    1. Значения позиции 5 (статус записи)—см. табл. 1.

Таблица 1

Значение позиции 5
маркера


Статус записи


Пояснение



С

Новая

Изменяющая

Ликвидирующая

ловарная статья вводится в мас­сиве впервые

Словарная статья вводится взамен ранее введенной статьи, запись кото­рой имеет тот же идентификатор

Запись ликвидирует ранее введен­ную запись с тем же идентификато­ром записи

    1. Значение позиции 20 маркера (длина поля «Длина поля данных») —4.

    2. Значение позиции 21 маркера (длина поля «Длина пози­ции начального символа») — 5.

    3. Значение позиции 22 (длина поля «Длина части, опре­деляемой при применении») — 4.

  1. Правила идентификации значения полей данных в статье справочника.

    1. Перечень устанавливаемых меток и их значения приве­дены в спецификации элементов данных (разд. 3). Различие се­мантических категорий полей данных определяет первый символ метки в соответствии с табл. 2.

    2. В первых трех позициях части, определяемой при при­менении, помещают латинский код языка соответствующего поля данных СТ СЭВ 251—76. Если для элемента данных указание языка не имеет смысла, эти позиции заполняют пробелами.

Четвертая позиция используется для указания связи между отдельными полями данных в пределах одной записи. Поля, со- 2—38

6



Таблица 2

Первый символ метки

Вид информации


01 1

Идентификационные данные

Заглавная лексическая единица словарной статьи

2

3- 4

5

6

Морфологические данные

Предметно-тематическая классификация Определения, примеры, контексты Отношения .между лексическими единицами Иноязычные эквиваленты заглавной лексической единицы

7

-8 9

Прочая информация Описание источника Резерв



держащие данные, которые следует рассматривать совместно, идентифицируют одинаковыми символами в указанной позиции. В этом случае символы выбирают последовательно из ряда 1, 9, А, ..., Z. Если связь между элементами данных не установле­на, в указанной позиции помещают пробел.

Пример. Антенны по диапазону подразделяются на широкопо­лосные, УКВ и др., по форме — на параболические, сферические И др.

Метка

Указатель связи

Лексическая единица

Пояснение


антенны

ЗЛЕ

540

1

диапазон

Аспект деления

532

1

широкополосные

Нижестоящее понятие



антенны

в аспекте деления «диа­




пазон»

532

1

УКВ — антенны

То же

540

2

форма

Аспект деления

532

2

параболические

Нижестоящее понятие



антенны

в аспекте деления, «фор­




ма»

532

2

сферические

То же



антенны


2.4. Пр

а в и л а з

а п и с и> информаци

и в полях дан-

Н Ы X

  1. Каждому элементу данных соответствует статья справоч­ника и поле данных. Семантика и значение элемента данных, а также его отношение к ЗЛЕ определяются меткой в статье спра­вочника. Все поля имеют переменную длину. (

  2. Все элементы данных в записи рассматривают по отно­шению к ЗЛЕ. Сгруппированные указателями связи элементы дан- пых также рассматривают как единое целое по отношению к ЗЛЕ. Если, группирование элементов данных указателями связи может вызвать неоднозначность или неясность понимания, следует при­водить пояснения в сопроводительной документации.

  3. Элементы данных записывают по одному в поле данных.

  4. При наличии нескольких экземпляров данных одной кате­гории каждый из них записывают в отдельном поле данных с одной и той же меткой в соответствующей каждому полю статье спра­вочника. Допустимость повторения элементов данйых указана в табл. 3.

Если применение нескольких экземпляров элементов данных с одинаковой меткой может вызвать неоднозначность или неясность понимания, следует приводить пояснения в сопроводительной до­кументации.

  1. Обязательность и применимость элементов данных для источников различных типов указана в табл. 3.

Таблица 3

Применение элементов данных

Метка

Наименование элемента данных

Повторяе­мость

Обязательность и применимость по типам источников (см. табл. 5)

В

Т

к

G

р

S

R

и

D

001

. Идентификатор записи

Нет

о

о

о

О

о

О

О

О

О

о

014

Создатель записи

Да

о

о

о

о

О

о

о

о

О

о

016

Дата создания записи

Нет

о

О

о

О

О

о

о

о

о

о

030

Комментарий

Да

н

н

н

н

н

н

н

н

н

н

100

Заглавная лексическая

единица

Да

о

о

О

о

о

О

о

о

о

о

115

Форма лексической едини­цы во вспомогательном ука­зателе

Да

н

н

н

н

н

н

н

н

н

н

130

Краткая форма

Да

н

н

н

н

н

н

+

+

н

131

Аббревиатура

Да

н

н

н

и

н

н

н

н

—;

н

132

Краткая форма словосоче­тания

Да

н

н

н

н

н

н

н

н

н

135

Полная форма

Да

н

н

н

н

н

н

+

+

н

150

Обозначение ЗЛЕ

Да

+

+

+

+

+

+

+

+

О

+

300

Индекс источника по Руб­рикатору ГАСНТИ

Да

о

О

О

о

О

о

О

о

о

о

301

Индекс источника .по Руб­рикатору МСНТИ

Да

н

н

н

н

н

н

н

н

н

н

302

Наименование классифи­кации

Да

н

н

н

н

н

н

н

н

н

н

303

Индекс тематики источни­ка

Да

н

н

н

н

н

н

н

н

н

н

304

Индекс тематики источни­ка по Рубрикатору, заре­гистрированному в АСВИЯ

Да

+

+

+

+

+

н

н

н

н

н