— відібрати поняття, що є найпридатнішими, з погляду деякої заданої групи користува пам’ятаючи при цьому про завдання індексування;
— змінити, якщо необхідно, процедуру індексування, виходячи з результатів зворот: зв’язку після опрацювання запитів. Проте така зміна не повинна суперечити структурі й л< мови індексування.
Не встановлюється жодних обмежень щодо кількості термінів індексування, от» понять, приписаних одному документу. Кількість понять визначається тільки кількістю ін<$ мації, що міститься в документі, з урахуванням завдань індексування. Встановлення будь-; обмежень щодо кількості понять може призвести до деякої втрати об'єктивності в процесі ін( сування і до втрати інформації, яка могла б бути корисною під час пошуку. Якщо в рамках я небудь організації виникає потреба в обмеженні кількості термінів індексування, відбір по; має визначатися міркуваннями індексатора щодо ролі того чи іншого поняття у вираженні п| мета документа.
Специфічність індексування визначається тим ступенем точності, з яким певне поі тя документа подається засобами мови індексування. Специфічність втрачається, коли пон; подається терміном більш загального значення.
Поняття повинні бути ідентифіковані з максимально можливим ступенем специфічне За певних обставин більш загальні поняття можуть бути прийнятнішими, наприклад у таких падках:
коли високий ступінь специфічності, на думку індексатора, може негативно вплинути на характеристики системи індексування. Наприклад, індексатор може вирішити замінити специфічні найменування моделей устаткування більш загальними термінами, наприклад найменуванням виробника чи найменуванням сімейства моделей, особливо, якщо ці поняття знаходяться на межі відповідної предметної галузі;
якщо індексатор вважає, що деяка ідея розкрита не досить повно або зазначена автором лише побіжно, і приписує відповідному поняттю низьку вагу.
ВІДБІР ТЕРМІНІВ ІНДЕКСУВАННЯ
Під час подання виявлених понять термінами індексування індексатор повинен дотримуватися таких правил (див. також додаток А):
поняття, подані в інформаційній мові, повинні бути виражені відповідними преференційними термінами (тобто дескрипторами);
терміни, що виражають нові поняття, повинні перевірятися щодо точності та прийнятності із залученням таких засобів: словників та енциклопедій, визнаних авторитетними в цій галузі; тезаурусів; класифікаційних систем.
Бажані також консультації зі спеціалістами відповідної предметної галузі, особливо з тими, хто має досвід у сфері індексування.
Індексатор повинен бути обізнаним із правилами застосування цих засобів індексування. Зокрема, він повинен усвідомлювати, що зазначені засоби можуть накладати певні обмеження. Наприклад, заданий наперед перелік предметних заголовків або склад розділів класифікаційної системи можуть не дозволити точно виразити поняття, зустрінуті в документі. Якщо поняття виражені класифікаційними індексами, слід розуміти, що ці індекси звичайно визначають ширший чи вужчий контекст (тобто основний клас), який може й не зовсім відповідати обстежуваному документу.
Якщо інформаційна мова включає тезаурус, кількість термінів, приписаних документу, може бути зменшена без втрат, тому що родові та інші відношення, що існують апріорі, можуть бути встановлені безпосередньо на підставі тезауруса. У випадку використання тезауруса для вираження певного поняття слід добирати найбільш спеціальний термін.
У деяких системах індексування використовуються індикатори ролі, зв’язку, ваги тощо. Індексатор повинен бути обізнаний з усіма спеціальними правилами, пов’язаними з цими механізмами.
На практиці індексатор часто зустрічає поняття, які відсутні в наявному тезаурусі чи класифікаційній системі. Залежно від використовуваної системи ці поняття можуть бути опрацьовані по-різному, наприклад:
вони можуть бути виражені термінами чи дескрипторами, які відразу вводяться в інформаційну мову;
вони можуть бути тимчасово виражені більш загальними термінами, а нові поняття можуть бути запропоновані як потенційні для пізнішого поповнення інформаційної мови.
КОНТРОЛЬ ЯКОСТІ ІНДЕКСУВАННЯ
Якість індексування залежить від таких чинників:
кваліфікація й досвід індексатора;
якість засобів індексування.
Якість індексування значною мірою визначається несуперечливістю індексування, яка полягає в тому, що склад термінів індексування, приписаних деякому документу, і досягнуті під час індексування рівні вичерпності та специфічності є в ідеалі незалежними від індексатора і залишаються незмінними протягом функціювання конкретної системи індексування. На практиці не завжди можливо досягти ідеалу несуперечливості, але прагнення до нього є важливим чинником, що впливає на характеристики системи індексування, особливо в разі обміну інформацією між різними організаціями в мережі.
Обов'язковою умовою для досягнення несуперечливості індексування є повна неупе редженість з боку індексатора в процесі ідентифікації понять і вибору термінів індексування. У раз коли є велика група індексаторів, що працюють у різних місцях, наприклад у децентралізованиі системах, для досягнення несуперечливості індексування рекомендовано введення етапу центра лізованої перевірки зі зворотним зв'язком з індексаторами.
Для забезпечення достатньої якості індексування індексатор повинен мати відповіде знання в тій предметній галузі, до якої відносяться обстежувані документи. Він повинен розумі ти терміни, що зустрічаються в документах, а також правила застосування конкретної інформа ційної мови.
У разі індексування чужомовних документів індексатор повинен володіти відповідною мово» або мати можливість звернутися по допомогу до відповідних фахівців.
Підвищенню якості індексування сприятимуть контакти індексаторів із користувачами Наприклад, з метою виявлення хибних термінологічних комбінацій, що можуть породжувати релевантну видачу під час інформаційного пошуку.
Якість індексування залежить також від гнучкості застосовуваної інформаційної мов| Бажано, щоб вона дозволяла вводити нові терміни та вносити зміни в термінологію.
Якість індексування слід перевіряти, де це можливо, шляхом аналізу результатів інфор маційного пошуку, наприклад, із використанням коефіцієнтів повноти й точності.
ДОДАТОК А
(довідковий)
БЛОК-СХЕМА ПРОЦЕДУРИ ІНДЕКСУВАННЯ
З ВИКОРИСТАННЯМ ТЕЗАУРУСА
УДК 002:001.815:006.354
01.140.20
Ті
Ключові слова: загальна методика, інформація, документація, індексування, предмет д кумента, термін індексування, інформаційна мова, тезаурус, класифікаційна система, інформ ційна діяльність.
ДЕРЖСТАНДАРТ УКРАЇНИ
Київ