— відібрати поняття, що є найпридатнішими, з погляду деякої заданої групи користува пам’ятаючи при цьому про завдання індексування;

— змінити, якщо необхідно, процедуру індексування, виходячи з результатів зворот: зв’язку після опрацювання запитів. Проте така зміна не повинна суперечити структурі й л< мови індексування.

    1. Не встановлюється жодних обмежень щодо кількості термінів індексування, от» понять, приписаних одному документу. Кількість понять визначається тільки кількістю ін<$ мації, що міститься в документі, з урахуванням завдань індексування. Встановлення будь-; обмежень щодо кількості понять може призвести до деякої втрати об'єктивності в процесі ін( сування і до втрати інформації, яка могла б бути корисною під час пошуку. Якщо в рамках я небудь організації виникає потреба в обмеженні кількості термінів індексування, відбір по; має визначатися міркуваннями індексатора щодо ролі того чи іншого поняття у вираженні п| мета документа.

  1. Специфічність індексування визначається тим ступенем точності, з яким певне поі тя документа подається засобами мови індексування. Специфічність втрачається, коли пон; подається терміном більш загального значення.

Поняття повинні бути ідентифіковані з максимально можливим ступенем специфічне За певних обставин більш загальні поняття можуть бути прийнятнішими, наприклад у таких падках:

  • коли високий ступінь специфічності, на думку індексатора, може негативно вплинути на характеристики системи індексування. Наприклад, індексатор може вирішити замінити спе­цифічні найменування моделей устаткування більш загальними термінами, наприклад найме­нуванням виробника чи найменуванням сімейства моделей, особливо, якщо ці поняття знахо­дяться на межі відповідної предметної галузі;

  • якщо індексатор вважає, що деяка ідея розкрита не досить повно або зазначена авто­ром лише побіжно, і приписує відповідному поняттю низьку вагу.

  1. ВІДБІР ТЕРМІНІВ ІНДЕКСУВАННЯ

    1. Під час подання виявлених понять термінами індексування індексатор повинен дотри­муватися таких правил (див. також додаток А):

  • поняття, подані в інформаційній мові, повинні бути виражені відповідними преференцій­ними термінами (тобто дескрипторами);

  • терміни, що виражають нові поняття, повинні перевірятися щодо точності та прийнят­ності із залученням таких засобів: словників та енциклопедій, визнаних авторитетними в цій галузі; тезаурусів; класифікаційних систем.

Бажані також консультації зі спеціалістами відповідної предметної галузі, особливо з тими, хто має досвід у сфері індексування.

  1. Індексатор повинен бути обізнаним із правилами застосування цих засобів індексуван­ня. Зокрема, він повинен усвідомлювати, що зазначені засоби можуть накладати певні обме­ження. Наприклад, заданий наперед перелік предметних заголовків або склад розділів класи­фікаційної системи можуть не дозволити точно виразити поняття, зустрінуті в документі. Якщо поняття виражені класифікаційними індексами, слід розуміти, що ці індекси звичайно визна­чають ширший чи вужчий контекст (тобто основний клас), який може й не зовсім відповідати обстежуваному документу.

  2. Якщо інформаційна мова включає тезаурус, кількість термінів, приписаних докумен­ту, може бути зменшена без втрат, тому що родові та інші відношення, що існують апріорі, можуть бути встановлені безпосередньо на підставі тезауруса. У випадку використання тезау­руса для вираження певного поняття слід добирати найбільш спеціальний термін.

  3. У деяких системах індексування використовуються індикатори ролі, зв’язку, ваги тощо. Індексатор повинен бути обізнаний з усіма спеціальними правилами, пов’язаними з цими меха­нізмами.

  4. На практиці індексатор часто зустрічає поняття, які відсутні в наявному тезаурусі чи класифікаційній системі. Залежно від використовуваної системи ці поняття можуть бути опра­цьовані по-різному, наприклад:

  • вони можуть бути виражені термінами чи дескрипторами, які відразу вводяться в інфор­маційну мову;

  • вони можуть бути тимчасово виражені більш загальними термінами, а нові поняття мо­жуть бути запропоновані як потенційні для пізнішого поповнення інформаційної мови.

  1. КОНТРОЛЬ ЯКОСТІ ІНДЕКСУВАННЯ

    1. Якість індексування залежить від таких чинників:

  • кваліфікація й досвід індексатора;

  • якість засобів індексування.

Якість індексування значною мірою визначається несуперечливістю індексування, яка по­лягає в тому, що склад термінів індексування, приписаних деякому документу, і досягнуті під час індексування рівні вичерпності та специфічності є в ідеалі незалежними від індексатора і залишаються незмінними протягом функціювання конкретної системи індексування. На прак­тиці не завжди можливо досягти ідеалу несуперечливості, але прагнення до нього є важливим чинником, що впливає на характеристики системи індексування, особливо в разі обміну інфор­мацією між різними організаціями в мережі.

  1. Обов'язковою умовою для досягнення несуперечливості індексування є повна неупе редженість з боку індексатора в процесі ідентифікації понять і вибору термінів індексування. У раз коли є велика група індексаторів, що працюють у різних місцях, наприклад у децентралізованиі системах, для досягнення несуперечливості індексування рекомендовано введення етапу центра лізованої перевірки зі зворотним зв'язком з індексаторами.

  2. Для забезпечення достатньої якості індексування індексатор повинен мати відповіде знання в тій предметній галузі, до якої відносяться обстежувані документи. Він повинен розумі ти терміни, що зустрічаються в документах, а також правила застосування конкретної інформа ційної мови.

У разі індексування чужомовних документів індексатор повинен володіти відповідною мово» або мати можливість звернутися по допомогу до відповідних фахівців.

  1. Підвищенню якості індексування сприятимуть контакти індексаторів із користувачами Наприклад, з метою виявлення хибних термінологічних комбінацій, що можуть породжувати релевантну видачу під час інформаційного пошуку.

  2. Якість індексування залежить також від гнучкості застосовуваної інформаційної мов| Бажано, щоб вона дозволяла вводити нові терміни та вносити зміни в термінологію.

Якість індексування слід перевіряти, де це можливо, шляхом аналізу результатів інфор маційного пошуку, наприклад, із використанням коефіцієнтів повноти й точності.

ДОДАТОК А
(довідковий)

БЛОК-СХЕМА ПРОЦЕДУРИ ІНДЕКСУВАННЯ
З ВИКОРИСТАННЯМ ТЕЗАУРУСА










































УДК 002:001.815:006.354


01.140.20


Ті




Ключові слова: загальна методика, інформація, документація, індексування, предмет д кумента, термін індексування, інформаційна мова, тезаурус, класифікаційна система, інформ ційна діяльність.

ДЕРЖСТАНДАРТ УКРАЇНИ

Київ