ГОСТ Р 50779.21-96

ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ОРГАНИЗАЦИИ

СТАТИСТИЧЕСКИЕ МЕТОДЫ

ПРАВИЛА ОПРЕДЕЛЕНИЯ И МЕТОДЫ РАСЧЕТА СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ПО ВЫБОРОЧНЫМ ДАННЫМ

Часть 1. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

ГОССТАНДАРТ РОССИИ

МОСКВА

Предисловие

1 РАЗРАБОТАН И ВНЕСЕН Техническим комитетом по стандартизации «Стандартизация статистических методов управления качеством» ТК 125

АО «Нижегородский научно-исследовательский центр контроля и диагностики технических систем» (АО НИЦ КД)

2 ПРИНЯТ И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Госстандарта России от 14 августа 1996 г. № 513

3 В настоящем стандарте учтены требования международного стандарта ИСО 2854-76 «Статистическое представление данных. Методы оценки и проверки гипотез о средних значениях и дисперсиях»

4 ВВЕДЕН ВПЕРВЫЕ

СОДЕРЖАНИЕ

1 область применения 2

2 нормативные ссылки 2

3 определения 2

4 обозначения и сокращения 3

5 общие требования 4

6 точечное и интервальное оценивание математического ожидания генеральной совокупности 5

7 точечное и интервальное оценивание дисперсии генеральной совокупности 11

8 точечное и интервальное оценивание доли распределения случайной величины в заданном интервале 14

Приложение а (справочное) Таблица значений функции стандартного нормального закона распределения 22

Приложение б (справочное) Таблица значений квантилей распределения стьюдента 24

Приложение в (справочное) Таблица значений квантилей c2-распределения 25

Приложение г (справочное) Таблицы значений квантилей распределения фишера 26

Введение

Стандарт устанавливает процедуры и методы решения ряда практических задач статистики в случае, когда наблюдаемые величины являются случайными и распределены по нормальному закону.

В стандарте изложены методы решения следующих задач:

а) точечного оценивания параметров нормального распределения случайной величины;

б) точечного оценивания вероятности попадания (доли распределения) случайной величины в заданный интервал и вне его;

в) интервального (доверительного) оценивания параметров и величин, указанных в подпунктах а и б;

г) проверки гипотез об этих же величинах.

Все приводимые процедуры используют ограниченный ряд статистических независимых наблюдений, полученных в производстве, в лабораторных условиях, при контроле, измерении, оценке и т. п.

ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Статистические методы

ПРАВИЛА ОПРЕДЕЛЕНИЯ И МЕТОДЫ РАСЧЕТА СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ПО ВЫБОРОЧНЫМ ДАННЫМ

Часть 1. Нормальное распределение

Statistical methods. Determination rules and methods for calculation of statistical characteristics based on sample data. Part 1. Normal distribution

Дата введения 1997-07-01

1 ОБЛАСТЬ ПРИМЕНЕНИЯ

Стандарт устанавливает методы, применяемые для:

- оценки математического ожидания и дисперсии генеральной совокупности;

- проверки гипотез относительно значений этих параметров;

- оценки вероятности попадания (доли распределения) случайной величины в заданный интервал.

Примечание - Вероятность попадания случайной величины в интервал равна доле распределения случайном величины в этом интервале. В большинстве практических задач физический смысл имеет понятие «доля распределения случайной величины в интервале», которое далее используют в данном стандарте.

Методы, изложенные в настоящем стандарте, применимы в том случае, если выполнены следующие условия:

- элементы выборки получены путем независимых повторений эксперимента. В случае конечной генеральной совокупности объем должен составлять не более 10 % объема генеральной совокупности;

- наблюдаемые переменные распределены по нормальному закону. Однако, если распределение вероятностей не сильно отличается от нормального, то описанные в стандарте методы остаются применимыми для большинства практических приложений. В этом случае объем выборки должен быть не менее 10, причем достоверность получаемых статистических выводов возрастает при увеличении объемов выборок.

2 НОРМАТИВНЫЕ ССЫЛКИ

В настоящем стандарте использована ссылка на ГОСТ 15895-77 Статистические методы управления качеством продукции. Термины и определения

3 ОПРЕДЕЛЕНИЯ

В настоящем стандарте применяют термины по ГОСТ 15895, а также приведенные ниже:

Точечное оценивание параметра - получение оценки параметра в виде одного численного значения.

Интервальное (доверительное) оценивание параметра - получение оценки параметра в виде доверительного интервала.

Доверительный интервал - интервал, границы которого являются функциями от выборочных данных и который накрывает истинное значение оцениваемого параметра с вероятностью не менее (1 - a), где (1 - a) - доверительная вероятность.

Примечание - Доверительный интервал может быть двусторонним или односторонним.

Нулевая гипотеза - предположение о распределении генеральной совокупности, которое проверяется по статистическим данным. В частности, в данном стандарте рассматривают предположения о значениях параметров распределения.

4 ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

m - математическое ожидание нормального закона распределения (среднее значение генеральной совокупности);

Примечание - Далее по тексту - среднее значение.

m0 - известное значение параметра m;

m1, m2 - математические ожидания для двух различных генеральных совокупностей;

- точечная оценка параметра m; = .

mв, mн - верхняя и нижняя доверительные границы параметра m;

(m1 - m2)Ù- точечная оценка разности значений параметров m1 и m2;

s - стандартное (среднее квадратическое) отклонение нормально распределенной случайной величины;

D - дисперсия генеральной совокупности, D = s2;

D0 - известное значение дисперсии генеральной совокупности, D0 = s20;

s0 - конкретное численное значение параметра s;

s01, s02 - известные значения параметров s1 и s2 для двух генеральных совокупностей;

- точечная оценка параметра s, = S;

sв, sн - верхняя и нижняя доверительные границы параметра s;

- точечная оценка дисперсии;

х - выборочное значение наблюдаемой случайной величины;

х1 - выборочное значение случайной величины из первой генеральной совокупности;

х2 - то же, из второй генеральной совокупности;

n, n1, n2 - объемы выборок;

- средние арифметические значения (выборочные средние);

- выборочное стандартное (среднее квадратическое) отклонение;

S1, S2 - то же, для двух выборок соответственно;

a - риск первого рода (вероятность отвергнуть гипотезу, когда она верна);

(1 - a) - доверительная вероятность, где a, 0 < a < 1, - уровень значимости при проверке гипотез;

v - число степеней свободы;

u1-a, u1-a/2 - квантили стандартного нормального закона распределения уровней 1 - a и 1 - a/2 соответственно;

t1-a(v), t1-a/2(v) - квантили распределения Стьюдента с v степенями свободы уровней 1-a и 1 - a/2 соответственно;

F1-a(v1, v2) - квантиль распределения Фишера уровня 1 - a с v1 и v2 степенями свободы;

c21-a(v), c21-a/2(v), c2a/2(v) - квантили c2-распределения c v степенями свободы уровней 1 - a, 1 - a/2 и a/2 соответственно;

L, М - нижняя и верхняя границы заданного интервала;

р - доля распределения (вероятность попадания) случайной величины в заданном интервале [L, М];

q - доля распределения (вероятность попадания) случайной величины вне интервала [L, М], причем q + р = 1;

- точечные оценки р и q;

pн, qн - нижние односторонние доверительные границы для р и q;

pв, qв - верхние односторонние доверительные границы для р и q;

С - случайное событие, например: попадание случайной величины в заданный интервал;

Prob {С} - вероятность случайного события С;

Sх - сумма выборочных значений х.

5 ОБЩИЕ ТРЕБОВАНИЯ

5.1 Настоящий стандарт содержит описание типовых статистических задач и процедур, при помощи которых они решаются. Представленные задачи могут быть разбиты на три класса:

- точечное и интервальное оценивание среднего значения генеральной совокупности;

- точечное и интервальное оценивание дисперсии генеральной совокупности;

- точечное и интервальное оценивание доли распределения (вероятности попадания) случайной величины в заданном интервале и вне его.

5.2 Для решения каждой из перечисленных задач по 5.1 приведены процедуры их решения (разделы 6, 7, 8), включающие в себя:

1) исходные и статистические данные;

2) определение стандартных табличных данных, которые необходимы для проведения вычислений (приложения А, Б, В, Г), а также проведения вычислений параметров и коэффициентов по приведенным формулам;

3) результаты, полученные в итоге проведенных вычислений.

5.3 Для задач каждого класса приведены примеры их применения на практике (в производстве, медицине, химии). Спектр возможных применений этих задач не ограничивается приведенными в разделах 6, 7, 8 примерами.

5.4 Во всех приведенных задачах предполагается, что исходные статистические данные подчиняются нормальному закону распределения. В тех случаях, когда изначально в этом нет достаточной уверенности, должны быть проведены предварительные исследования соответствия исходных данных нормальному закону.

5.5 Процедуры решения перечисленных в 5.2 задач представлены в таблицах, соответствующих этим задачам (разделы 6, 7, 8).

Для удобства пользования таблицами разделов 6, 7, 8 задачи соответствующих разделов перечислены в обобщенных таблицах 5.1, 5.2, 5.3, 5.4.

Таблица 5.1 - Номера таблиц для решения задач по оценке среднего значения (раздел 6)

Задача оценки среднего значения

Номер таблицы

D известна

D неизвестна

Оценка

6.1

6.2

Сравнение среднего значения с заданной величиной

6.3

6.4

Сравнение двух средних

6.5

6.6

Оценка разности двух средних

6.7

6.8

Таблица 5.2 - Номера таблиц для решения задач по оценке дисперсии (раздел 7)

Задача оценки дисперсии

Номер таблицы

Оценка дисперсии

7.1

Сравнение дисперсии или стандартного отклонения с заданной величиной

7.2

Сравнение двух дисперсий или двух стандартных отклонений

7.3

Таблица 5.3 - Номера таблиц для решения задач по точечной оценке доли распределения случайной величины в заданном интервале (раздел 8)

Номер таблицы

D известна

D неизвестна

8.2

8.3

Таблица 5.4 - Номера таблиц для решения задач по интервальной оценке доли распределения случайной величины при неизвестной дисперсии в заданном интервале

Заданные границы интервала

Искомая величина

Номер таблицы

L

pн, qв

8.4

М

pн, qв

8.5

L, М

pн, qв

8.6

L

pв, qн

8.7

М

pв, qн

8.8

L, М

pв, qн

8.9

5.6 Процедуры интервального оценивания доли распределения случайной величины в заданном интервале, изложенные в разделе 8 настоящего стандарта, являются простыми для применения, но не самыми эффективными. Более эффективными являются процедуры с использованием таблиц нецентрального распределения Стьюдента или таблиц толерантных множителей, которые не приводятся в настоящем стандарте.

6 ТОЧЕЧНОЕ И ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

6.1 Алгоритм точечного и интервального оценивания среднего значения при известной дисперсии приведен в таблице 6.1.

Таблица 6.1 - Оценка среднего значения при известной дисперсии

Статистические и исходные данные

Табличные данные и вычисления

1 Объем выборки:

n =

1 Квантиль стандартного нормального закона распределения уровня (1 - a):

u1-a =

2 Сумма значений наблюдаемых величин:

Sx =

2 Квантиль стандартного нормального закона распределения уровня (1 - a/2):

u1-a/2 =

3 Известное значение дисперсии:

s20

3 Вычисляем:

4 Выбранная доверительная вероятность:

1 - a

4 Вычисляем:


5 Вычисляем:

Результаты:

1 Точечная оценка параметра m:

= =

2 Двусторонний симметричный доверительный интервал для m:

- К2s0£ m £ + К2s0

3 Односторонние доверительные интервалы для m:

m £ + К1s0 или

m ³ - К1s0

Примечание - Квантили стандартного нормального закона распределения определяют по таблице А.1 приложения А