ГОСУДАРСТВЕННЫЙ СТАНДАРТ
СОЮЗА ССР
СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ, БИБЛИОТЕЧНОМУ
И ИЗДАТЕЛЬСКОМУ ДЕЛУ
КОММУНИКАТИВНЫЙ ФОРМАТ
ДЛЯ СЛОВАРЕЙ ИНФОРМАЦИОННЫХ
ЯЗЫКОВ И ТЕРМИНОЛОГИЧЕСКИХ
ДАННЫХ
СОДЕРЖАНИЕ ЗАПИСИ
И
Цена 10 коп.
ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР ПО СТАНДАРТАМ
Москва
ГОСУДАРСТВЕННЫЙ СТАНДАРТ
СОЮЗА ССР
СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ, БИБЛИОТЕЧНОМУ
И ИЗДАТЕЛЬСКОМУ ДЕЛУ
КОММУНИКАТИВНЫЙ ФОРМАТ
ДЛЯ СЛОВАРЕЙ ИНФОРМАЦИОННЫХ
ЯЗЫКОВ И ТЕРМИНОЛОГИЧЕСКИХ
ДАННЫХ
СОДЕРЖАНИЕ ЗАПИСИ
Издание официальное
МОСКВА-1 984РАЗРАБОТАН
Государственным комитетом СССР по стандартам Государственным комитетом СССР по науке и технике Академией наук СССР
Государственным комитетом СССР по делам изобретений и открытий
Министерством авиационной промышленности
Министерством судостроительной промышленности ИСПОЛНИТЕЛИ
В. И. Федосимов, Г. Г. Белоногов, А. В. Веселовский, Ю. В. Сипапин, А. А. Полтев, Л. Ю. Герасимов, Э. П. Зарубин (руководители темы), В. А. Гарбарчик, В. Н. Белоозеров, Л. П. Веряскина, Н. Д. Кравченко, Е. Н. Казаков, В. С. Горбаченко, А. Б. Антопольский, Ю. Ф. Протопопов, Ю. П. Венедиктов
ВНЕСЕН Государственным комитетом СССР по стандартам
Зам. председателя В. И. Киларенко
УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Государственного комитета СССР по стандартам от 28 февраля 1984 г. № 70
7
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР
Система стандартов по информации, библиотечному и
издательскому делу
К
ГОСТ
7.47-84
Содержание записи
System of standards on information, iibraries and
publishing. Communicative format for vocabularies of
information retrieval languages and terminological data.
Content of records
ОКСТУ OOOZ
Постановлением Государственного комитета СССР по стандартам от 28 февраля 1984 г. № 707 срок введения установлен
c 01.01.85
Настоящий стандарт устанавливает коммуникативный формат записи лексической информации на магнитной ленте, в том числе содержание записи, состав и идентификацию элементов данных.
Стандарт распространяется на представление на магнитной ленте лексики словарей информационных языков, терминологических и других лексикографических источников для обмена между автоматизированными информационными системами и обязателен для органов научно-технической информации.
Обозначение настоящего коммуникативного формата ФОЛИЯ — формат обмена лексикой информационных языков.
В части представления информационно-поисковых тезаурусов стандарт следует применять совместно с ГОСТ 7.25—80.
ОБЩИЕ ПОЛОЖЕНИЯ
Коммуникативный формат используют для записи на магнитной ленте информации из следующих лексикографических источников:
одноязычные информационно-поисковые тезаурусы;
многоязычные информационно-поисковые тезаурусы;
рубрикаторы (классификации) научно-технической информации (включая УДК и Рубрикатор ГАСНТИ)
;списки (словари) предметных рубрик;
стандарты на термины и определения;
терминологические словари и справочники.
Коммуникативный формат предназначен только для обмена данными. Структура записей не ориентирована на информационный поиск и не обязательна к применению в качестве внутренней структуры данных в конкретных информационных системах.
Лексикографический источник представляется в формате ФОЛИЯ последовательностью записей, каждая из которых соответствует одной словарной статье источника. Основным элементом записи является заглавная лексическая единица (ЗЛЕ). Это элемент словника лексикографического источника, о котором в данной словарной статье содержится дополнительная информация.
Одна магнитная лента может содержать записи, относящиеся к одному и к нескольким источникам, причем каждый источник может быть представлен полностью или частично.
Применяя записи различного типа, можно отразить на магнитной ленте систематическую классификацию лексических единиц, вставляя между записями с терминами записи с рубриками систематического указателя источника, а также представить источники, содержащие различные виды указателей лексических единиц.
Для обеспечения синхронного ведения одинаковых или связанных источников в различных информационных системах в формате предусмотрены средства передачи изменений в лексическом составе источника.
Тип структуры данных, описываемых средствами коммуникативного формата — одноуровневое дерево с различными типами связей и возможностью группирования семантически связанных вершин. В каждой записи присутствует ЗЛЕ и другие элементы данных с указанием их роли или связи по отношению к ЗЛЕ с помощью меток элементов данных.
Если в процессе развития лексических и терминологических систем возникает потребность в установлении новых видов семантических отношений и связей, не представленных в настоящем стандарте, их добавляют регистрацией в Автоматизированной системе ведения информационных языков (АСВИЯ) ГАСНТИ.
Кодирование данных в коммуникативном формате должно соответствовать требованиям СТ СЭВ 358—76 (таблица КОИ-8), кодирование расширенного списка символов — ГОСТ 7.28—80, ГОСТ 7.29—80, ГОСТ 7.30—80. Структура элементов данных, требующих для своего представления расширения 8-битных кодов—■ по СТ СЭВ 360—76. Допускается применять код ДКОИ, если достаточно представления информации одними прописными буквами.СПОСОБ ПРЕДСТАВЛЕНИЯ ЛЕКСИКОГРАФИЧЕСКОЙ ИНФОРМАЦИИ
Структура записи на магнитной ленте (МЛ) должна соответствовать требованиям ГОСТ 7.14—84.
Используют вариант структуры без индикаторов и идентификаторов.
Для представления информации Макротезауруса ГАСНТИ допускается использовать варианты структуры с индикаторами и идентификаторами.
Применяют блокированные записи переменной длины с максимальной длиной блока 16000 байт.
Значения компонентов маркера записи
Значения позиции 5 (статус записи)—см. табл. 1.
Таблица 1
Значение позиции 5
маркера
Статус записи
Пояснение
С
Новая
Изменяющая
Ликвидирующая
ловарная статья вводится в массиве впервыеСловарная статья вводится взамен ранее введенной статьи, запись которой имеет тот же идентификатор
Запись ликвидирует ранее введенную запись с тем же идентификатором записи
Значение позиции 20 маркера (длина поля «Длина поля данных») —4.
Значение позиции 21 маркера (длина поля «Длина позиции начального символа») — 5.
Значение позиции 22 (длина поля «Длина части, определяемой при применении») — 4.
Правила идентификации значения полей данных в статье справочника.
Перечень устанавливаемых меток и их значения приведены в спецификации элементов данных (разд. 3). Различие семантических категорий полей данных определяет первый символ метки в соответствии с табл. 2.
В первых трех позициях части, определяемой при применении, помещают латинский код языка соответствующего поля данных СТ СЭВ 251—76. Если для элемента данных указание языка не имеет смысла, эти позиции заполняют пробелами.
Четвертая позиция используется для указания связи между отдельными полями данных в пределах одной записи. Поля, со- 2—38
6
|
Таблица 2 |
Первый символ метки |
Вид информации |
01 1 |
Идентификационные данные Заглавная лексическая единица словарной статьи |
2 3- 4 5 6 |
Морфологические данные Предметно-тематическая классификация Определения, примеры, контексты Отношения .между лексическими единицами Иноязычные эквиваленты заглавной лексической единицы |
7 -8 9 |
Прочая информация Описание источника Резерв |
держащие данные, которые следует рассматривать совместно, идентифицируют одинаковыми символами в указанной позиции. В этом случае символы выбирают последовательно из ряда 1, 9, А, ..., Z. Если связь между элементами данных не установлена, в указанной позиции помещают пробел.
Пример. Антенны по диапазону подразделяются на широкополосные, УКВ и др., по форме — на параболические, сферические И др.
Метка |
Указатель связи |
Лексическая единица |
Пояснение |
|
— |
антенны |
ЗЛЕ |
540 |
1 |
диапазон |
Аспект деления |
532 |
1 |
широкополосные |
Нижестоящее понятие |
|
|
антенны |
в аспекте деления «диа |
|
|
|
пазон» |
532 |
1 |
УКВ — антенны |
То же |
540 |
2 |
форма |
Аспект деления |
532 |
2 |
параболические |
Нижестоящее понятие |
|
|
антенны |
в аспекте деления, «фор |
|
|
|
ма» |
532 |
2 |
сферические |
То же |
|
|
антенны |
|
2.4. Пр |
а в и л а з |
а п и с и> информаци |
и в полях дан- |
Н Ы X
Каждому элементу данных соответствует статья справочника и поле данных. Семантика и значение элемента данных, а также его отношение к ЗЛЕ определяются меткой в статье справочника. Все поля имеют переменную длину. (
Все элементы данных в записи рассматривают по отношению к ЗЛЕ. Сгруппированные указателями связи элементы дан- пых также рассматривают как единое целое по отношению к ЗЛЕ. Если, группирование элементов данных указателями связи может вызвать неоднозначность или неясность понимания, следует приводить пояснения в сопроводительной документации.
Элементы данных записывают по одному в поле данных.
При наличии нескольких экземпляров данных одной категории каждый из них записывают в отдельном поле данных с одной и той же меткой в соответствующей каждому полю статье справочника. Допустимость повторения элементов данйых указана в табл. 3.
Если применение нескольких экземпляров элементов данных с одинаковой меткой может вызвать неоднозначность или неясность понимания, следует приводить пояснения в сопроводительной документации.
Обязательность и применимость элементов данных для источников различных типов указана в табл. 3.
Таблица 3
Применение элементов данных
Метка |
Наименование элемента данных |
Повторяемость |
-м |
Обязательность и применимость по типам источников (см. табл. 5) |
|||||||||||
В |
Т |
к |
G |
р |
S |
R |
и |
D |
|||||||
001 |
. Идентификатор записи |
Нет |
о |
о |
о |
О |
о |
О |
О |
О |
О |
о |
|||
014 |
Создатель записи |
Да |
о |
о |
о |
о |
О |
о |
о |
о |
О |
о |
|||
016 |
Дата создания записи |
Нет |
о |
О |
о |
О |
О |
о |
о |
о |
о |
о |
|||
030 |
Комментарий |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
|||
100 |
Заглавная лексическая единица |
Да |
о |
о |
О |
о |
о |
О |
о |
о |
о |
о |
|||
115 |
Форма лексической единицы во вспомогательном указателе |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
|||
130 |
Краткая форма |
Да |
н |
н |
н |
н |
н |
н |
+ |
+ |
— |
н |
|||
131 |
Аббревиатура |
Да |
н |
н |
н |
и |
н |
н |
н |
н |
—; |
н |
|||
132 |
Краткая форма словосочетания |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
н |
||||
135 |
Полная форма |
Да |
н |
н |
н |
н |
н |
н |
+ |
+ |
— |
н |
|||
150 |
Обозначение ЗЛЕ |
Да |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
О |
+ |
|||
300 |
Индекс источника по Рубрикатору ГАСНТИ |
Да |
о |
О |
О |
о |
О |
о |
О |
о |
о |
о |
|||
301 |
Индекс источника .по Рубрикатору МСНТИ |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
|||
302 |
Наименование классификации |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
|||
303 |
Индекс тематики источника |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
|||
304 |
Индекс тематики источника по Рубрикатору, зарегистрированному в АСВИЯ |
Да |
+ |
+ |
+ |
+ |
+ |
н |
н |
н |
н |
н |