6.1.4 Использование робастных методов для анализа данных не влияет на планирование, организацию или выполнение эксперимента по оценке прецизионности. Решение об использовании робастных методов или методов выявления и удаления выбросов должно приниматься экспертом по статистике и представляться в совет экспертов. При использовании робастных методов в ходе обработки данных необходимо, как и в других случаях, проводить тесты на наличие выбросов, проверку совместимости (однородности), как это описано в ГОСТ Р ИСО 5725-2 или ГОСТ Р ИСО 5725-5, а также исследовать причины отдельных выбросов или графики по статистикам h и k. Однако сами исходные данные не должны исключаться как результаты этих измерений и проверок.

6.1.5 Знаменатели в формулах для статистик h и k являются стандартными отклонениями, которые в соответствии с методами расчета этих статистик, описанными в ГОСТ Р ИСО 5725-2, рассчитывают на основе представленных данных. Присутствие выбросов в этих данных будет изменять знаменатели, что приведет к искажениям в графиках этих статистик. Например, если на каком-то уровне эксперимента одна лаборатория выдает, что среднее значение в элементе является необычно большим выбросом, так что его величина намного больше, чем у любых других выбросов на том же уровне, то на графике статистики h это будет выглядеть в виде непомерно большого значения h для этого уровня. Однако значение статистики h для всех других лабораторий на этом же уровне будет малым, даже если несколько других лабораторий имеют выбросы. К подобному эффекту в расчетах статистики h может привести и использование общего среднего. В то же время использование робастных оценок стандартных отклонений как знаменателей в статистиках h и k и робастных оценок общих средних в расчете статистики h позволяет избежать этого искажения. Поэтому их и рекомендуется использовать для этих целей.

6.1.6 Данные эксперимента по оценке прецизионности позволяют рассчитать статистики двух типов:

a) средние значения в элементах, по которым рассчитывают стандартное отклонение, определяющее оценку межлабораторного расхождения;

b) стандартные отклонения или расхождения в пределах элементов (в том числе расхождения в эксперименте с распределенными уровнями), которые объединяют, чтобы получить оценку внутрилабораторного расхождения (вариации).

Робастные методы, описанные здесь, не подменяют эти средние значения в элементах, стандартные отклонения или расхождения (или вариации), различия, а обеспечивают альтернативные способы их сочетания для получения статистик, используемых для расчетов стандартных отклонений повторяемости и воспроизводимости.

Например, для значений одного уровня в эксперименте по модели с однородными уровнями, рассмотренном в ГОСТ Р ИСО 5725-2, первым этапом анализа является расчет среднего и стандартного отклонений результатов измерений в каждом элементе. Средние значения в элементах затем используют для расчетов стандартного отклонения, которое является оценкой межлабораторного расхождения. Когда используют робастные методы, изложенные в этом пункте, расчет выполняют с использованием Алгоритма А и средние значения в элементах не исключают из расчетов в результате применения к ним критерия Граббса. Также по этой модели эксперимента стандартные отклонения в элементах объединяют, чтобы оценить стандартное отклонение повторяемости. Если при этом использовать робастный анализ, то применяют Алгоритм S, который позволяет не исключать стандартные отклонения в элементах в результате использования критерия Кохрена. С любым подходом (описанным либо в ГОСТ Р ИСО 5725-2, либо здесь) обе эти оценки затем одинаковым образом используют для расчетов оценок стандартных отклонений повторяемости и воспроизводимости.

Более сложный пример шестифакторного ступенчато вложенного эксперимента приведен в приложении С ГОСТ Р ИСО 5725-3. Согласно этой модели первым этапом анализа является расчет средних значений по данным для каждой лаборатории (на каждом уровне), обозначаемых yi(1), ..., yi(5), и серий расхождений, обозначаемых wi(1), ..., wi(5), которые содержат информацию о вариабельности, присущей различным факторам, контролируемым в эксперименте. Для анализа данных описанными здесь робастными методами применяют Алгоритм А к средним значениям элементов, а Алгоритм S - к каждой серии расхождений по очереди. Статистики, полученные в результате этих операций, используют затем для оценок стандартных отклонений повторяемости, промежуточной прецизионности и воспроизводимости таким же образом, как и в методе анализа, описанном в ГОСТ Р ИСО 5725-3.

6.1.7 Робастные методы, включенные в эту часть ГОСТ Р ИСО 5725, были выбраны потому, что они могут быть применимы ко всем экспериментальным моделям, приведенным в частях 2-5 ГОСТ Р ИСО 5725, а также потому, что предлагаемые в них расчеты относительно просты. Необходимо заметить, однако, что при этом обеспечиваются робастные способы объединения лишь средних значений, стандартных отклонений и расхождений в элементах. Описанные робастные методы не объединяют индивидуальные результаты измерений (испытаний), то есть они начинают с арифметических средних и стандартных отклонений в элементах. Имеются, однако, методы, которые объединяют результаты измерений (испытаний) в пределах элементов робастным способом, но они могут быть более сложными при применении на практике.

6.2 Робастный анализ. Алгоритм А

6.2.1 Этот алгоритм дает робастные величины среднего и стандартного отклонений данных, к которым он применяется, а именно:

a) средним значениям в элементах для любой модели;

b) расхождениям в элементах для модели с распределенными уровнями.

6.2.2 Обозначим индексом р общее число данных, расположенных в порядке возрастания: х1, х2, …, хi, …, хp.

Обозначим робастные среднее и стандартное отклонения этих данных х* и s*.

6.2.3 Рассчитаем первоначальные значения для х* и s* в виде:

х* = медиана от хi (i = 1, 2, ..., р),(56)

s* = 1,483 ?? медиана от | хi - х*| (i =1, 2, ..., р).(57)

6.2.4 Обновим значения х* и s*, как показано ниже.

Рассчитаем

?? = 1,5 s*.(58)

Для каждого значения xi (i = 1, 2, ..., р) рассчитывают:

(59)

Рассчитывают новые значения х* и s* по формулам:

(60)

(61)

6.2.5 Робастные оценки х* и s* могут быть получены итеративным расчетом, то есть повторением расчетов по 6.2.4 несколько раз, до тех пор, пока изменения в оценках х* и s* от одного расчета до следующего станут минимальными. Этот метод прост для программирования на компьютере.

6.2.6 Альтернативный метод без итерации легко применим для расчетов вручную с использованием уравнений (60), (61), которые можно представить в виде:

(62)

(63)

где uL - число значений элементов xi, для которых xi < х* - ??;

uU - число значений элементов xi, для которых xi > х* - ??;

х´ и s´ - средние значения и стандартные отклонения (р - uL - uU) значений элементов хi, для которых| xi - х* | ?? ??.

Эти данные можно использовать, чтобы прямо рассчитать х* и s*, если известны uL и uU. Один из способов - проверить различные возможности, систематизировав их (то есть попытаться получить uL = 0, и uU = 0; затем uL = 0, uU = 1; затем uL = 1, uU = 0; затем uL = 1, uU = 1 и так далее) до нахождения правильного решения, в котором фактическое количество элементов, отличающихся от х* более чем на 1,5 s*, равно значениям uL и uU, использованным для расчета s* и х*. На практике аналитик может использовать гистограммы, подобные приведенным на рисунке 4, чтобы установить значения, которые вероятно отличаются от х* более чем на 1,5 s*, и таким образом найти решение, оценив малое число вариантов.

Еще одна возможность состоит в том, чтобы использовать итеративный метод для нахождения приближенного, а затем точного решения, с помощью уравнений (62) и (63). Этот подход использован в примерах, приведенных ниже.

6.3 Робастный анализ. Алгоритм S

6.3.1 Этот алгоритм применяют для внутрилабораторного стандартного отклонения (или внутрилабораторных расхождений) в любой модели эксперимента. Он дает робастное среднеквадратичное значение для стандартных отклонений или расхождений, к которым применен.

6.3.2 Обозначим индексом р общее число данных, расположенных в порядке возрастания: w1, w2, …, wi, …, wp.

(Это могут быть расхождения или стандартные отклонения).

Обозначим робастные среднеквадратичные значения w*, а число степеней свободы, связанных с каждым wi, через ν. (Когда wi - расхождение, ν = 1. Когда wi - стандартное отклонение из п результатов, ν = п - 1). В таблице 23 находим соответствующие значения ξ и η, необходимые для использования алгоритма.

6.3.3 Найдем первоначальное значение для w* в виде

w* = медиана (середина по индексам) от wi (i = 1, 2, ..., р).(64)

6.3.4 Обновляют величины w* следующим образом.

Рассчитывают

.(65)

Для каждого wi (i = 1, 2, ..., р) рассчитывают

(66)

Рассчитывают новое значение w* по формуле

(67)

6.3.5 Робастная оценка w* может быть получена итеративным способом повторением расчетов по 6.3.4 несколько раз, пока изменение оценки w* от первого расчета до последующего станет минимальным. Это простой метод для программирования на компьютере.

6.3.6 Альтернативный метод без использования итерации легко применим для расчетов вручную, аналогично описанному в 6.2.6. Уравнение (67) может быть представлено в виде

(68)

где Σ΄ - суммирование тех wi, для которых wi < ψ;

иU - число wi, для которых wi > ψ.

Это можно решить подбором, положив иU = 0, иU = 1, иU = 2 и так далее до момента, при котором действительное количество значений wi, превышающих η ?? w*, станет равным иU. На практике аналитик может использовать гистограммы, подобные приведенным на рисунке 4, чтобы установить расхождения, которые вероятно превышают η ?? w*, и таким образом найти решение, оценив небольшое число вариантов.

Подход, который используют в примерах, приведенных ниже, состоит в использовании итеративного метода для приближенного решения, а затем в вычислении уравнения (68) для нахождения точного решения.

Таблица 23 - Факторы, необходимые для робастного анализа. Алгоритм S

Степень свободы ν

Ограничительный фактор η

Согласующий фактор ξ

1

1,645

1,097

2

1,517

1,054

3

1,444

1,039

4

1,395

1,032

5

1,359

1,027

6

1,332

1,024

7

1,310

1,021

8

1,292

1,019

9

1,277

1,018

10

1,264

1,017

Примечание - Значения η и ξ выведены согласно приложению В.

6.4 Формулы. Робастный анализ для отдельного уровня в эксперименте по модели с однородными уровнями

6.4.1 Робастная оценка стандартного отклонения повторяемости sr для какого-либо уровня этой модели может быть получена применением алгоритма S к расхождениям или стандартным отклонениям в элементах для получения робастного значения w* из уравнения (67). Если алгоритм S применяют к стандартным отклонениям в элементах, то

sr = w*.(69)

Если в элементе имеются два результата измерений и алгоритм S применяют к расхождениям в элементах, то

.(70)

6.4.2 Робастная оценка стандартного отклонения средних значений в элементах sd для некоторого уровня может быть получена применением к ним Алгоритма А, получением робастного значения s* из уравнения (61), а затем использованием равенства

sd = s*.(71)

6.4.3 Затем может быть получено межлабораторное стандартное отклонение sl на основе равенства

(72)

где n - число результатов измерений в элементе.

Если выражение под корнем отрицательное, тогда принимают

sL = 0.(73)

Стандартное отклонение воспроизводимости для определенного уровня равно

(74)

6.5 Пример 4. Робастный анализ для отдельного уровня в эксперименте по модели с однородными уровнями

6.5.1 Пример 3 в ГОСТ Р ИСО 5725-2 иллюстрирует модель с однородными уровнями, в котором данные содержат квазивыбросы и выбросы. Уровень 5 в этом примере представляет определенный интерес, поскольку лаборатория № 1 дала среднее значение в элементах, близкое к квазивыбросу по критерию Граббса, а лаборатория № 6 - по критерию Кохрена. Эти данные представлены в таблице 24.

Таблица 24 - Пример 4. Термометрическое титрование креозотного масла (% креозота)

Номер лаборатории i

Данные

Среднее значение в элементе

Расхождение в элементе

1

24,28

24,00

24,140

0,28

2

20,40

19,91

20,155

0,49

3

19,30

19,70

19,500

0,40

4

20,30

20,30

20,300

0,00

5

20,53

20,88

20,705

0,35

6

18,56

16,58

17,570

1,98

7

19,70

20,50

20,100

0,80

8

21,10

20,78

20,940

0,32

9

20,71

21,66

21,185

0,95

6.5.2 Если сохранить данные всех лабораторий, то стандартные отклонения повторяемости и воспроизводимости могут быть оценены с использованием формул по 7.4 ГОСТ Р ИСО 5725-2, которые дают:

p = 9;

т = 20,511;