В данном Приложении приведены общие критерии для статистических методов, которые мо­гут использоваться как необходимые для руководства специальными применениями.

В случае новых программ межлабораторных сличений часто наблюдается вначале плохое совпадение результатов вследствие новой проблематики, новых форм искусственных контрольных образцов, плохого совпадения методов, или из-за изменений лабораторией методик. Координаторам, возможно, придется применять робастные меры относительных показателей (такие как процентили) до улучшения совпадения результатов. Может потребоваться уточнение статистических методов, как только будет улучшено совпадение результатов между лабораториями и должным образом установ­лена проверка на качество проведения испытаний.

В данном Приложении не рассматриваются статистические методы для аналитических иссле­дований помимо методов для обработки данных проверки на качество проведения испытаний. Для реализации других применений данных межлабораторных сличений могут потребоваться различные методы, перечисленные во введении.

ПРИМЕЧАНИЕ — ИСО/ТК 69 в настоящее время готовит документ, в котором будет пред­ставлена подробная информация по статистическим методам, содержащимся в данном Приложении.

А.1 Определение приписанного значения и его неопределенности

А.1.1 Имеются различные методики для установления приписанных значений. Большинство общих методик перечислены ниже в порядке, в больше случаев, возрастания неопределенности при­писанного значения. В них используются следующие подходы.

  1. Известные значения — результаты определяются с помощью специального состава ис­пытываемого образца (напр., изготовление или разбавление раствора).

  2. Аттестованные эталонные значения — значения, определенные с помощью определен­ных дефинитивных методов (для количественных испытаний).

  3. Эталонные значения — значения, определенные с помощью анализа, измерения или сравнения испытываемого образца по эталонному материалу или эталону, прослеживаемым к нацио­нальному или международному эталону.

  4. Согласованные значения от лабораторий-экспертов — лаборатории-эксперты должны обладать компетентностью, которую они могут продемонстрировать при измерении определяемых величин(ы), используя стандартные методы, которые, известны как, обладающие высокой прецизи­онностью и сличимы с методами для общего применения. В некоторых случаях такими лаборатория­ми могут быть эталонные лаборатории.

  5. Согласованные значения от лабораторий-участников — использование статистических данных, описанных в А.1.3 с анализом влияний экстремальных значений.

  6. 1.2 Следует определить приписанные значения для того, чтобы справедливо оценить участников, а также и для того, чтобы способствовать согласованности между лабораториями и ме­тодами. Это осуществляется посредством отбора всюду, где это возможно, общих групп для сличе­ния и посредством использования общих приписанных значений.

  7. 1.3 Когда приписанные значения определяются по согласованным методам, могут ока­заться пригодными следующие статистические данные:

  1. качественное значение — согласованное решение по предварительно определенному большинству в процентном отношении (обычно выражается по номинальной или порядковой шкале);

  2. количественное значение — “среднее” для соответствующей группы сличений, такое как

  1. среднее, которое может быть взвешенным или преобразованным (напр., округ­

ленное или геометрическое среднее),

  1. медиана, мода или другая робастная мера.

А.1.4 Там, где необходимо, следует определить неопределенность приписанных значений, используя методики, описанные в “Руководстве для выражения неопределенности измерения”.

А.1.5 Экстремальные результаты трактуют следующим образом.

  1. Когда результаты участников используются для определения приписанных значений, сле­дует применять методы, позволяющие свести к минимуму влияние экстремальных результатов. Это можно осуществить с помощью робастных статистических методов или путем удаления выбросов до выполнения расчетов (см. ИСО 5725-2). В программах более широкого масштаба или в повседневных программах, возможно, надо иметь автоматизированные фильтры для устранения выбросов.

  2. Если результаты удаляются как выбросы, их следует удалять только для расчета суммар­ных статистических данных. Эти результаты все таки следует оценить в программе проверки на каче­ство проведения испытаний и присвоить соответствующую квалификационную оценку способности проводить испытания.

А.1.6 Следующие соображения.

  1. В идеале, если приписанные значения определяются с помощью эталонного значения или как согласованное решение участников, то координатору следует иметь методику для установления правильности приписанных значений и для анализа распределения данных.

  2. Координатору следует иметь критерии для приемлемости приписанного значения на осно­вании его неопределенности.

А.2 Расчет статистических данных, характеризующих способность проводить испыта­ния

А.2.1 Техническая компетентность проводить испытания на одиночных контрольных образцах

А.2.1.1 Результаты проверки на качество проведения испытаний часто требуется преобразо­вать в статистические данные, характеризующие способность проводить испытания, чтобы оказать помощь в объяснений этих результатов и позволить выполнить сличение для определенных целей. Цель заключается в измерении отклонения от приписанного значения способом, который позволяет выполнить сличение с критериями, характеризующими техническую компетентность проводить испы­тания. Могут использоваться самые различные методы: от методов, в которых не требуется обработ­ка данных, до сложных статистических преобразований.

А.2.1.2 Меры, характеризующие техническую компетентность проводить испытания, должны быть содержательными для участников программы. Поэтому меры следует соотнести с прикладными потребностями испытания, и их следует правильно понимать или они должны быть общепринятыми в данной области.

А.2.1.3 Для расчета статистических данных, характеризующих способность проводить испы­тания, и в итоговых отчетах по программам проверки на качество проведения испытаний часто ис­пользуются меры изменчивости. К общим примерам таких мер изменчивости для соответствующей групп сличения относятся:

  1. стандартное отклонение (SD);

  2. коэффициент вариации (CV);

  3. относительное стандартное отклонение (RSD);

  4. процентиль, абсолютное отклонение медианы или другие робастные меры.

  5. 2.1.4 Для результатов по качественному составу расчет обычно не требуется.

Ниже перечислены широко распространенные статистические данные для количественных результатов в порядке возрастания степени преобразования результатов участников.

  1. Разность (х-Х), где “х” есть результат участника, а “Х” есть приписанное значение.

  2. Процентная разность

(х - Х)

X 100

Х

  1. Процентиль или ранг.

  2. Количественные показатели z, где

х-Х

z = ,

s

s — соответствующая оценка/мера изменчивости, которая выбирается так, чтобы она удовле­творяла требованиям программы. Эта модель может использоваться как в случае, когда X и s выво­дятся из результатов участников, так и когда X и s не выводятся из результатов (всех) участников. [Например, когда приписанные значения и изменчивость установлены; см. 4.2 из Международного гармонизированного протокола для проверки (химических) аналитических лабораторий на качест­во проведения испытаний.]

  1. критерий Еп (обычно используются в программах сличения измерений), где

x - X

En = —————— , ^ U lab + Uref

U2lab — неопределенность результата участника, а U2ref — неопределенность приписанного значения эталонной лаборатории.

А.2.1.5 Рассмотрим следующее:

  1. Простая разность между результатом участника и приписанным значением может быть достаточной для определения технической компетентности проводить испытания и ее наиболее легко понимают участники. Величина (х - Х) называется в ИСО 5725-4 “оценкой смещения лаборатории”.

  2. Процентная разность подходит для концентрации, и ее хорошо понимают участники.

  3. Процентили или ранги полезны для результатов сильно рассеянных или с асимметричных, для одинарных ответов или когда имеется ограниченное число различных ответов. Этот метод сле­дует использовать осторожно (см. 6.6.5).

  4. Преобразованные результаты могут быть предпочтительны или необходимы в зависимо­сти от характера испытания. Например, результаты, основанные на разбавлении растворов, пред­ставляют собой вид геометрической шкалы, преобразуемой по логарифмам.

  5. Если используются статистические критерии (напр., количественные показатели z), оценки изменчивости должны быть надежны; то есть, основаны на достаточном количестве наблюдений, чтобы уменьшить влияние экстремальных результатов и добиться низкой неопределенности.

А.2.2 Комбинированные количественные показатели, характеризующие техническую компетентность проводить испытания

А.2.2.1 Техническая компетентность проводить испытания может оцениваться на основе бо­лее, чем одного результата в одиночном цикле проверки на качество проведения испытаний. Это происходит тогда, когда имеется более одного контрольного образца для конкретной измеряемой ве­личины или семейства взаимосвязанных измеряемых величин. Это делается для обеспечения более исчерпывающей оценки способности проводить испытания.

Графические методы, такие как график Юдена или график, демонстрирующий h - статистику Манделя, являются эффективными способами пояснения способности проводить испытания (см. ИСО 5725-2).

Можно привести следующие примеры:

  1. Комбинированный количественный показатель для одной и той же измеряемой величины:

  • число удовлетворительных результатов;

  • средний или суммарный количественный показатель z;

  • средняя абсолютная разность (в единицах измерения или процентах);

  • суммарная абсолютная разность (или квадратичная разность).

  1. Составной количественный показатель для различных измеряемых величин:

  • число (или процент) удовлетворительных результатов;

  • средний абсолютный количественный показатель z;

  • средняя абсолютная разность по отношению к пределам оценки.

А.2.2.2 Рассмотрим следующие соображения.

  1. Количественные показатели (при необходимости) могут быть преобразованы, с тем чтобы они все удовлетворяли одному и тому ожидаемому распределению (напр., Гауссову для количест­венных показателей z или %12 - распределению для квадратов разностей).

  2. Следует выполнить проверку для экстремальных значений, которые могли бы существенно повлиять на составной количественный показатель.

А.3 Оценка способности проводить испытания

А.3.1 Первоначальная способность проводить испытания

После того, как будет принято во внимание, учитывает ли мера для оценки способности про­водить испытания некоторые особенности, следует установить критерии для оценки способности проводить испытания.

А.3.1.1 Эти особенности следующие.

  1. Консенсус экспертов: когда консультативная группа или другие квалифицированные экс­перты непосредственно определяют, подходят ли представленные результаты для данной цели. Кон­сенсус экспертов — это типовой способ оценить результаты качественных испытаний.

  2. Соответствие назначению: учитывает, например, технические требования к технической компетентности проводить испытания, которые заложены в методе, и признанный уровень работы участников.

  3. Статистический расчет количественных показателей: когда критерии должны быть при­годными для каждого количественного показателя. Общеизвестные примеры применения количест­венных показателей следующие:

1) для количественных показателей z:

А.3.1.3 Всякий раз, когда это возможно, следует использовать графики, чтобы продемонстри­ровать способность проводить испытания (напр., гистограммы, столбиковые диаграммы погрешно­стей, упорядоченные диаграммы количественных показателей z). Эти диаграммы могут использо­ваться для отображения:

  1. распределений значений участников:

  2. отношения между результатами, полученными на многочисленных контрольных образцах;

  3. сравнительных распределений для различных методов.

  4. 3.2 Надзор за технической компетентностью проводить испытания

  5. 3.2.1 Программа проверки на качество проведения испытаний может включать методы кон­троля способности проводить испытания с течением времени. Статистические методы должны по­зволять участникам наблюдать изменчивость в своей технической компетентности проводить испы­тания, имеются ли общие тенденции, или несовместимости и где техническая компетентность прово­дить испытания изменяется случайно.

  6. 3.2.2 Для того, чтобы широкий круг читателей мог легко интерпретировать результаты, сле­дует использовать графические методы. Полезны традиционные контрольные карты “Шухарта”, осо­бенно для целей самосовершенствования. Распечатки данных и суммарные статистические данные позволяют осуществлять более подробный анализ. Для построения этих графиков и таблиц следует использовать статистические данные, применяемые для оценки способности проводить испытания.

  7. 4 Предварительное определение однородности контрольного образца