6.1.4 Использование робастных методов для анализа данных не влияет на планирование, организацию или выполнение эксперимента по оценке прецизионности. Решение об использовании робастных методов или методов выявления и удаления выбросов должно приниматься экспертом по статистике и представляться в совет экспертов. При использовании робастных методов в ходе обработки данных необходимо, как и в других случаях, проводить тесты на наличие выбросов, проверку совместимости (однородности), как это описано в ГОСТ Р ИСО 5725-2 или ГОСТ Р ИСО 5725-5, а также исследовать причины отдельных выбросов или графики по статистикам h и k. Однако сами исходные данные не должны исключаться как результаты этих измерений и проверок.
6.1.5 Знаменатели в формулах для статистик h и k являются стандартными отклонениями, которые в соответствии с методами расчета этих статистик, описанными в ГОСТ Р ИСО 5725-2, рассчитывают на основе представленных данных. Присутствие выбросов в этих данных будет изменять знаменатели, что приведет к искажениям в графиках этих статистик. Например, если на каком-то уровне эксперимента одна лаборатория выдает, что среднее значение в элементе является необычно большим выбросом, так что его величина намного больше, чем у любых других выбросов на том же уровне, то на графике статистики h это будет выглядеть в виде непомерно большого значения h для этого уровня. Однако значение статистики h для всех других лабораторий на этом же уровне будет малым, даже если несколько других лабораторий имеют выбросы. К подобному эффекту в расчетах статистики h может привести и использование общего среднего. В то же время использование робастных оценок стандартных отклонений как знаменателей в статистиках h и k и робастных оценок общих средних в расчете статистики h позволяет избежать этого искажения. Поэтому их и рекомендуется использовать для этих целей.
6.1.6 Данные эксперимента по оценке прецизионности позволяют рассчитать статистики двух типов:
a) средние значения в элементах, по которым рассчитывают стандартное отклонение, определяющее оценку межлабораторного расхождения;
b) стандартные отклонения или расхождения в пределах элементов (в том числе расхождения в эксперименте с распределенными уровнями), которые объединяют, чтобы получить оценку внутрилабораторного расхождения (вариации).
Робастные методы, описанные здесь, не подменяют эти средние значения в элементах, стандартные отклонения или расхождения (или вариации), различия, а обеспечивают альтернативные способы их сочетания для получения статистик, используемых для расчетов стандартных отклонений повторяемости и воспроизводимости.
Например, для значений одного уровня в эксперименте по модели с однородными уровнями, рассмотренном в ГОСТ Р ИСО 5725-2, первым этапом анализа является расчет среднего и стандартного отклонений результатов измерений в каждом элементе. Средние значения в элементах затем используют для расчетов стандартного отклонения, которое является оценкой межлабораторного расхождения. Когда используют робастные методы, изложенные в этом пункте, расчет выполняют с использованием Алгоритма А и средние значения в элементах не исключают из расчетов в результате применения к ним критерия Граббса. Также по этой модели эксперимента стандартные отклонения в элементах объединяют, чтобы оценить стандартное отклонение повторяемости. Если при этом использовать робастный анализ, то применяют Алгоритм S, который позволяет не исключать стандартные отклонения в элементах в результате использования критерия Кохрена. С любым подходом (описанным либо в ГОСТ Р ИСО 5725-2, либо здесь) обе эти оценки затем одинаковым образом используют для расчетов оценок стандартных отклонений повторяемости и воспроизводимости.
Более сложный пример шестифакторного ступенчато вложенного эксперимента приведен в приложении С ГОСТ Р ИСО 5725-3. Согласно этой модели первым этапом анализа является расчет средних значений по данным для каждой лаборатории (на каждом уровне), обозначаемых yi(1), ..., yi(5), и серий расхождений, обозначаемых wi(1), ..., wi(5), которые содержат информацию о вариабельности, присущей различным факторам, контролируемым в эксперименте. Для анализа данных описанными здесь робастными методами применяют Алгоритм А к средним значениям элементов, а Алгоритм S - к каждой серии расхождений по очереди. Статистики, полученные в результате этих операций, используют затем для оценок стандартных отклонений повторяемости, промежуточной прецизионности и воспроизводимости таким же образом, как и в методе анализа, описанном в ГОСТ Р ИСО 5725-3.
6.1.7 Робастные методы, включенные в эту часть ГОСТ Р ИСО 5725, были выбраны потому, что они могут быть применимы ко всем экспериментальным моделям, приведенным в частях 2-5 ГОСТ Р ИСО 5725, а также потому, что предлагаемые в них расчеты относительно просты. Необходимо заметить, однако, что при этом обеспечиваются робастные способы объединения лишь средних значений, стандартных отклонений и расхождений в элементах. Описанные робастные методы не объединяют индивидуальные результаты измерений (испытаний), то есть они начинают с арифметических средних и стандартных отклонений в элементах. Имеются, однако, методы, которые объединяют результаты измерений (испытаний) в пределах элементов робастным способом, но они могут быть более сложными при применении на практике.
6.2 Робастный анализ. Алгоритм А
6.2.1 Этот алгоритм дает робастные величины среднего и стандартного отклонений данных, к которым он применяется, а именно:
a) средним значениям в элементах для любой модели;
b) расхождениям в элементах для модели с распределенными уровнями.
6.2.2 Обозначим индексом р общее число данных, расположенных в порядке возрастания: х1, х2, …, хi, …, хp.
Обозначим робастные среднее и стандартное отклонения этих данных х* и s*.
6.2.3 Рассчитаем первоначальные значения для х* и s* в виде:
х* = медиана от хi (i = 1, 2, ..., р),(56)
s* = 1,483 ?? медиана от | хi - х*| (i =1, 2, ..., р).(57)
6.2.4 Обновим значения х* и s*, как показано ниже.
Рассчитаем
?? = 1,5 s*.(58)
Для каждого значения xi (i = 1, 2, ..., р) рассчитывают:
(59)
Рассчитывают новые значения х* и s* по формулам:
(60)
(61)
6.2.5 Робастные оценки х* и s* могут быть получены итеративным расчетом, то есть повторением расчетов по 6.2.4 несколько раз, до тех пор, пока изменения в оценках х* и s* от одного расчета до следующего станут минимальными. Этот метод прост для программирования на компьютере.
6.2.6 Альтернативный метод без итерации легко применим для расчетов вручную с использованием уравнений (60), (61), которые можно представить в виде:
(62)
(63)
где uL - число значений элементов xi, для которых xi < х* - ??;
uU - число значений элементов xi, для которых xi > х* - ??;
х´ и s´ - средние значения и стандартные отклонения (р - uL - uU) значений элементов хi, для которых| xi - х* | ?? ??.
Эти данные можно использовать, чтобы прямо рассчитать х* и s*, если известны uL и uU. Один из способов - проверить различные возможности, систематизировав их (то есть попытаться получить uL = 0, и uU = 0; затем uL = 0, uU = 1; затем uL = 1, uU = 0; затем uL = 1, uU = 1 и так далее) до нахождения правильного решения, в котором фактическое количество элементов, отличающихся от х* более чем на 1,5 s*, равно значениям uL и uU, использованным для расчета s* и х*. На практике аналитик может использовать гистограммы, подобные приведенным на рисунке 4, чтобы установить значения, которые вероятно отличаются от х* более чем на 1,5 s*, и таким образом найти решение, оценив малое число вариантов.
Еще одна возможность состоит в том, чтобы использовать итеративный метод для нахождения приближенного, а затем точного решения, с помощью уравнений (62) и (63). Этот подход использован в примерах, приведенных ниже.
6.3 Робастный анализ. Алгоритм S
6.3.1 Этот алгоритм применяют для внутрилабораторного стандартного отклонения (или внутрилабораторных расхождений) в любой модели эксперимента. Он дает робастное среднеквадратичное значение для стандартных отклонений или расхождений, к которым применен.
6.3.2 Обозначим индексом р общее число данных, расположенных в порядке возрастания: w1, w2, …, wi, …, wp.
(Это могут быть расхождения или стандартные отклонения).
Обозначим робастные среднеквадратичные значения w*, а число степеней свободы, связанных с каждым wi, через ν. (Когда wi - расхождение, ν = 1. Когда wi - стандартное отклонение из п результатов, ν = п - 1). В таблице 23 находим соответствующие значения ξ и η, необходимые для использования алгоритма.
6.3.3 Найдем первоначальное значение для w* в виде
w* = медиана (середина по индексам) от wi (i = 1, 2, ..., р).(64)
6.3.4 Обновляют величины w* следующим образом.
Рассчитывают
.(65)
Для каждого wi (i = 1, 2, ..., р) рассчитывают
(66)
Рассчитывают новое значение w* по формуле
(67)
6.3.5 Робастная оценка w* может быть получена итеративным способом повторением расчетов по 6.3.4 несколько раз, пока изменение оценки w* от первого расчета до последующего станет минимальным. Это простой метод для программирования на компьютере.
6.3.6 Альтернативный метод без использования итерации легко применим для расчетов вручную, аналогично описанному в 6.2.6. Уравнение (67) может быть представлено в виде
(68)
где Σ΄ - суммирование тех wi, для которых wi < ψ;
иU - число wi, для которых wi > ψ.
Это можно решить подбором, положив иU = 0, иU = 1, иU = 2 и так далее до момента, при котором действительное количество значений wi, превышающих η ?? w*, станет равным иU. На практике аналитик может использовать гистограммы, подобные приведенным на рисунке 4, чтобы установить расхождения, которые вероятно превышают η ?? w*, и таким образом найти решение, оценив небольшое число вариантов.
Подход, который используют в примерах, приведенных ниже, состоит в использовании итеративного метода для приближенного решения, а затем в вычислении уравнения (68) для нахождения точного решения.
Таблица 23 - Факторы, необходимые для робастного анализа. Алгоритм S
Степень свободы ν |
Ограничительный фактор η |
Согласующий фактор ξ |
1 |
1,645 |
1,097 |
2 |
1,517 |
1,054 |
3 |
1,444 |
1,039 |
4 |
1,395 |
1,032 |
5 |
1,359 |
1,027 |
6 |
1,332 |
1,024 |
7 |
1,310 |
1,021 |
8 |
1,292 |
1,019 |
9 |
1,277 |
1,018 |
10 |
1,264 |
1,017 |
Примечание - Значения η и ξ выведены согласно приложению В. |
6.4 Формулы. Робастный анализ для отдельного уровня в эксперименте по модели с однородными уровнями
6.4.1 Робастная оценка стандартного отклонения повторяемости sr для какого-либо уровня этой модели может быть получена применением алгоритма S к расхождениям или стандартным отклонениям в элементах для получения робастного значения w* из уравнения (67). Если алгоритм S применяют к стандартным отклонениям в элементах, то
sr = w*.(69)
Если в элементе имеются два результата измерений и алгоритм S применяют к расхождениям в элементах, то
.(70)
6.4.2 Робастная оценка стандартного отклонения средних значений в элементах sd для некоторого уровня может быть получена применением к ним Алгоритма А, получением робастного значения s* из уравнения (61), а затем использованием равенства
sd = s*.(71)
6.4.3 Затем может быть получено межлабораторное стандартное отклонение sl на основе равенства
(72)
где n - число результатов измерений в элементе.
Если выражение под корнем отрицательное, тогда принимают
sL = 0.(73)
Стандартное отклонение воспроизводимости для определенного уровня равно
(74)
6.5 Пример 4. Робастный анализ для отдельного уровня в эксперименте по модели с однородными уровнями
6.5.1 Пример 3 в ГОСТ Р ИСО 5725-2 иллюстрирует модель с однородными уровнями, в котором данные содержат квазивыбросы и выбросы. Уровень 5 в этом примере представляет определенный интерес, поскольку лаборатория № 1 дала среднее значение в элементах, близкое к квазивыбросу по критерию Граббса, а лаборатория № 6 - по критерию Кохрена. Эти данные представлены в таблице 24.
Таблица 24 - Пример 4. Термометрическое титрование креозотного масла (% креозота)
Номер лаборатории i |
Данные |
Среднее значение в элементе |
Расхождение в элементе |
|
1 |
24,28 |
24,00 |
24,140 |
0,28 |
2 |
20,40 |
19,91 |
20,155 |
0,49 |
3 |
19,30 |
19,70 |
19,500 |
0,40 |
4 |
20,30 |
20,30 |
20,300 |
0,00 |
5 |
20,53 |
20,88 |
20,705 |
0,35 |
6 |
18,56 |
16,58 |
17,570 |
1,98 |
7 |
19,70 |
20,50 |
20,100 |
0,80 |
8 |
21,10 |
20,78 |
20,940 |
0,32 |
9 |
20,71 |
21,66 |
21,185 |
0,95 |
6.5.2 Если сохранить данные всех лабораторий, то стандартные отклонения повторяемости и воспроизводимости могут быть оценены с использованием формул по 7.4 ГОСТ Р ИСО 5725-2, которые дают:
p = 9;
т = 20,511;