МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И СЕРТИФИКАЦИИ
(МГС)

I

ГОСТ 7.24- 2007

NTERSTATE COUNCIL FOR STANDARDIZATION, METROLOGY AND CERTIFICATION
(ISC)

МЕЖГОСУДАРСТВЕННЫЙ
СТАНДАРТ

Система стандартов по информации,
библиотечному и издательскому делу

ТЕЗАУРУС ИНФОРМАЦИОННО-ПОИСКОВЫЙ
МНОГОЯЗЫЧНЫЙ

Состав, структура и основные требования
к построению

Издание официальное


П

Москва Стандарти нформ 2010

редисловие

Цели, основные принципы и основной порядок проведения работ по межгосударственной стандар­тизации установлены ГОСТ 1.0—92 «Межгосударственная система стандартизации. Основные положе­ния» и ГОСТ 1.2—97 «Межгосударственная система стандартизации. Стандарты межгосударственные, правила и рекомендации по межгосударственной стандартизации. Порядок разработки, принятия, при­менения, обновления и отмены»

Сведения о стандарте

  1. РАЗРАБОТАН Всероссийским институтом научной и технической информации Российской ака­демии наук

  2. ВНЕСЕН Федеральным агентством по техническому регулированию и метрологии

  3. ПРИНЯТ Межгосударственным советом по стандартизации, метрологии и сертификации (про­токол № 31 от 8 июня 2007 г.)

За принятие проголосовали:

Краткое наименование страны по МК (ИСО 3166) 004—97

Код страны по МК (ИСО 3166) 004—97

Сокращенное наименование национального органа по стандартизации

Азербайджан Армения Беларусь Г рузия Кыргызстан Молдова

Российская Федерация

Таджикистан Туркменистан Узбекистан Казахстан

AZ АМ BY GE KG

MD RU

TJ TM

UZ KZ

Азстандарт

Армстандарт

Госстандарт Республики Беларусь

Г рузстандарт

Кыргызстандарт

Молдова-Стандарт

Федеральное агентство по техническому регулирова­нию и метрологии

Таджи кета н да рт

Главгосслужба «Туркменстандартлары»

Агентство «Узстандарт»

Госстандарт Республики Казахстан



  1. Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО 5964:1985 «Документация. Руководство по построению и разработке многоязычных тезаурусов» (ISO 5964:1985 «Guidelinesfor the establishment and development of multilingual thesauri», IDT)

  2. Приказом Федерального агентства по техническому регулированию и метрологии от 31 октября 2007 г. № 287-ст межгосударственный стандарт ГОСТ 7.24—2001 введен в действие в качестве нацио­нального стандарта Российской Федерации с 1 июля 2008 г.

  3. ВЗАМЕН ГОСТ 7.24—90

  4. ПЕРЕИЗДАНИЕ. Февраль 2010 г.

Информация о введении в действие (прекращении действия) настоящего стандарта публику­ется в указателе «Национальные стандарты».

Информация об изменениях к настоящему стандарту публикуется в указателе «Национальные стандарты», а текст изменений — в информационных указателях «Национальные стандарты». В случае пересмотра или отмены настоящего стандарта соответствующая информация будет опубликована в информационном указателе «Национальные стандарты»

© Стандартинформ, 2007

© СТАНДАРТИНФОРМ, 2010

В Российской Федерации настоящий стандарт не может быть полностью или частично воспроиз­веден, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

Содержание

  1. Область применения 1

  2. Нормативные ссылки 1

  3. Термины и определения 1

  4. Состав и структура тезауруса 2

Основные требования к построению многоязычных информационно-поисковых тезаурусов .... 2 Приложение А (справочное) Примеры использования средств указания эквивалентности дескрипторов в одноязычных версиях 6

МЕЖГОСУДАРСТВЕННЫЙ


СТАНДАРТ


Система стандартов по информации, библиотечному и издательскому делу

ТЕЗАУРУС ИНФОРМАЦИОННО-ПОИСКОВЫЙ МНОГОЯЗЫЧНЫЙ

Состав, структура и основные требования к построению

System of standards on information, librarianship and publishing. Multilingual thesaurus for information retrieval.
Composition, structure and basic requirements for development

Дата введения — 2008—07—01

  1. Область применения

Настоящий стандарт распространяется на многоязычные информационно-поисковые тезаурусы (далее — МИПТ) и устанавливает состав, структуру и основные требования к построению МИПТ, приме­няемых в информационно-поисковых системах.

  1. Нормативные ссылки

В настоящем стандарте использованы ссылки на следующие межгосударственные стандарты:

ГОСТ 7.25—2001 Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления

ГОСТ 7.74—96 Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения

Примечание — При пользовании настоящим стандартом целесообразно проверить действие ссылоч­ных стандартов по указателю «Национальные стандарты», составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться заменяющим (изменен­ным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяется в части, не затрагивающей эту ссылку.

  1. Термины и определения

В настоящем стандарте применены термины по ГОСТ 7.74, а также следующие термины с соответ­ствующими определениями:

  1. многоязычный информационно-поисковый тезаурус: Информационно-поисковый тезау­рус, содержащий лексические единицы, взятые из нескольких естественных языков и представляющий эквивалентные по смыслу понятия на каждом из этих языков.

Примечание — Предназначен для обработки документов (запросов) и информационного поиска с целью обмена информацией на различных естественных языках.

  1. одноязычный информационно-поисковый тезаурус: Информационно-поисковый тезау­рус, содержащий лексические единицы, взятые из одного естественного языка.

  2. язык-компонент МИПТ: Язык, на основе которого разработана какая-либо из одноязычных версий.

Издание официальное

    1. дескриптор МИПТ: Основная лексическая единица МИПТ, представляющая собой совокуп­ность эквивалентных дескрипторов одноязычных версий, связанных средствами для указания эквива­лентности.

  1. Состав и структура тезауруса

    1. Обязательными составными частями МИПТ являются:

  • вводная часть;

  • алфавитные лексико-семантические указатели, включающие средства для указания эквива­лентности дескрипторов одноязычных версий (см. 4.4). Допускается в состав тезауруса вводить систе­матические, пермутационные, иерархические и другие указатели и списки специальных категорий лексических единиц, а также приложения, содержащие дополнительные сведения о разработке и использовании МИПТ.

  1. Вводная часть включает титульный лист и введение, составленные согласно ГОСТ 7.25 и изло­женные на одном или нескольких языках-компонентах.

На титульном листе следует указывать все языки-компоненты. Рекомендуется наименование тезауруса на титульном листе формулировать на одном языке, а дополнительно косновному титульно­му листу включать во вводную часть титульные листы на всех языках-компонентах. Введение должно содержать краткое описание методических принципов установления эквивалентности дескрипторов одноязычных версий, а также указание на то, что тезаурус разработан в соответствии с настоящим стан­дартом. Рекомендуется в состав вводной части включать полный или сокращенный перевод введения на всех языках-компонентах.

  1. Алфавитный лексико-семантический указатель в каждой из одноязычных версий содержит перечень тезаурусных статей, расположенных в алфавитном порядке заглавных лексических единиц на соответствующем языке-компоненте. Состав и структура тезаурусных статей в лексико-семантических указателях одноязычных версий — по ГОСТ 7.25.

  2. Средствадля указания эквивалентности дескриптороводноязычных версий реализуются вве­дением в тезаурусную статью кода эквивалентности дескрипторов (идентификационного кода) и (или) эквивалентных дескрипторов на языках-компонентах.

При использовании идентификационных кодов в дополнение к алфавитному лексико-семантичес­кому указателю МИПТ составляют указатель идентификационных кодов, в котором каждому коду припи­сывают соответствующие дескрипторы одноязычных версий.

  1. Систематические, иерархические и пермутационные указатели строятся по ГОСТ 7.25 на язы­ках-компонентах и содержат средства для указания эквивалентности дескрипторов одноязычных вер­сий. Примеры использования средств для указания эквивалентности дескрипторов приведены в приложении А.

  2. Состав и структура одноязычных версий должны соответствовать следующим требованиям:

  • в каждой одноязычной версии должны содержаться все дескрипторы, необходимые для пред­ставления онтологии предметной области с целью поиска и обмена информацией между системами, использующими различные языки;

  • классы условной эквивалентности лексических единиц одноязычных версий должны соответ­ствовать друг другу по объему выражаемых понятий;

  • соответствующие друг другу дескрипторы отдельных одноязычных версий должны иметь по воз­можности максимально совпадающие парадигматические отношения.

Одноязычные версии допускается дополнять дескрипторами, не являющимися необходимыми для межъязыкового обмена и отсутствующими в других одноязычных версиях; при этом указывают иерархическую подчиненность их какому-либо дескриптору МИПТ.

Одноязычные версии могут включать парадигматические отношения, отсутствующие в других одноязычных версиях, если они на данном языке-компоненте уточняют понятия, выраженные дескрип­тором МИПТ, и не противоречат его пониманию в других языках-компонентах.

  1. Основные требования к построению многоязычных информационно-поисковых тезаурусов

    1. Содержание работ по формированию одноязычных версий определяют наличием или отсут­ствием одноязычных тезаурусов по данной тематике на языках-компонентах.

      1. При отсутствии одноязычных тезаурусов по данной тематике на языках-компонентах, как правило, сначала создают одну одноязычную версию и на ее основе строят остальные.

Возможна также совместная разработка одновременно всех или нескольких одноязычных версий при взаимном согласовании состава дескрипторов и их парадигматических связей.

    1. При наличии тезауруса по данной тематике на одном из языков-компонентов, как правило, его берут за основу разрабатываемого МИПТ. Другие одноязычные версии формируют подбором экви­валентов дескрипторов этого тезауруса на языках-компонентах. При этом возможны различные степени семантического соответствия эквивалентов дескрипторов на различных языках.

    2. При наличии нескольких исходных тезаурусов по данной тематике на языках-компонентах разработка МИПТ ведется подбором эквивалентных дескрипторов в данных тезаурусах (см. 5.2.1 и 5.2.2). Дескрипторы, не имеющие эквивалентов в отдельных одноязычных версиях, переводят на соот­ветствующие языки и включают в одноязычные версии, в которых этот дескриптор первоначально отсут­ствовал. При этом следует вносить в исходные тезаурусы изменения, необходимые для согласования одноязычных версий.

    3. Рекомендуется одну из одноязычных версий выбирать в качестве базовой и устанавливать эквивалентность дескрипторов других одноязычных версий по отношению кдескрипторам базовой вер­сии.

  1. При установлении эквивалентности дескрипторов различных одноязычных версий необходи­мо различать на разных языках-компонентах следующие степени эквивалентности терминов:

  • полная;

  • неполная;

  • частичная;

  • отсутствие эквивалентного термина.

  1. При наличии в языках-компонентах полностью эквивалентныхтерминов их считают предста­вителями одного дескриптора МИПТ.

  2. При отсутствии в языках-компонентах полных эквивалентов для выражения одного и того же понятия в качестве дескриптора МИПТ в одноязычных версиях используют неполные и частичные экви­валенты.

Неполными эквивалентами являются термины, для которых объемы выражаемых ими понятий пересекаются.

Частичными эквивалентами являются термины, для которых объем понятия, выражаемого одним эквивалентом, входит в объем понятия, выражаемого другим эквивалентом.

  1. Если различие в объеме понятий между неполными или частичными эквивалентами несу­щественно для данного МИПТ, то их можно использовать для представления дескриптора МИПТ в раз­ных одноязычных версиях, например:

ги: АННОТАЦИЯ

fr: RESUME

  1. Если различие в объеме понятий между неполными или частичными эквивалентами существенно, то при представлении дескриптора МИПТ водноязычных версияхзначение используемо­го термина уточняют одним из следующих способов:

  • добавлением релятора (см. 5.2.2.3);

  • добавлением примечания (см. 5.2.2.4);

  • включением термина в уточняющее словосочетание с определяющими словами (см. 5.2.2.5);

  • введением условно эквивалентных аскрипторов в тезаурусную статью дескриптора одноязыч­ной версии (см. 5.2.2.6);

  • использованием комбинации двух или более терминов (см. 5.2.2.7).