МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И СЕРТИФИКАЦИИ
(МГС)
I
ГОСТ ИСО 114532005
NTERSTATE COUNCIL FOR STANDARDIZATION, METROLOGY AND CERTIFICATIONМЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ
Статистические методы
СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Проверка гипотез и доверительные интервалы
для пропорций
ISO 11453:1996
Statistical interpretation of data —
Tests and confidence intervals relating to proportions
(IDT)
Издание официальное
БЗ 1—2005/212
ой
Москва
Стандартинформ
200
6Предисловие
Цели, основные принципы и основной порядок проведения работ по межгосударственной стандартизации установлены ГОСТ 1.0—92 «Межгосударственная система стандартизации. Основные положения» и ГОСТ 1.2—97 «Межгосударственная система стандартизации. Стандарты межгосударственные, правила, рекомендации по межгосударственной стандартизации. Порядок разработки, принятия, применения, обновления и отмены»
Сведения о стандарте
1 РАЗРАБОТАН Открытым акционерным обществом «Научно-исследовательский центр контроля и диагностики технических систем»(ОАО НИЦКД), Межгосударственным техническим комитетом по стандартизации МТК 125 «Статистические методы в управлении качеством продукции»
2 ВНЕСЕН Федеральным агентством по техническому регулированию и метрологии Российской Федерации
3 ПРИНЯТ Межгосударственным советом по стандартизации, метрологии и сертификации (протокол № 28 от 9 декабря 2005 г.)
За принятие проголосовали:
Краткое наименование страны по МК (ИСО 3166) 004—97 |
Код страны по МК (ИСО 3166) 004—97 |
Сокращенное наименование национального органа по стандартизации |
Азербайджан Армения Беларусь Казахстан Кыргызстан Молдова Российская Федерация Таджикистан Туркменистан Узбекистан Украина |
АМ BY KG MD RU TJ TM uz UA |
Азстандарт Армстандарт Госстандарт Республики Беларусь Госстандарт Республики Казахстан Кыргызстандарт Молдова-Стандарт Федеральное агентство по техническому регулированию и метрологии Таджикстандарт Главгосслужба «Туркменстандартлары» Узстандарт Госпотребстандарт Украины |
4 Настоящий стандарт идентичен международному стандарту ИСО 11453:1996 «Статистическое представление данных. Проверка гипотез и доверительные интервалы для пропорций» (IS011453:1996 «Statistical interpretation of data — Tests and confidence intervals relating to proportions»).
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ 1.5.
Степень соответствия — идентичная (IDT).
Приказом Федерального агентства по техническому регулированию и метрологии от 29 июня 2006 г. № 125-ст межгосударственный стандарт ГОСТ ИС011453—2005 введен в действие с 1 сентября 2006 г.
5 ВВЕДЕН ВПЕРВЫЕ
Информация о введении в действие (прекращении действия) настоящего стандарта публикуется в указателе «Национальные стандарты».
Информация об изменениях к настоящему стандарту публикуется в указателе (каталоге) «Национальные стандарты», а текст изменений — в информационных указателях «Национальные стандарты». В случае пересмотра или отмены настоящего стандарта соответствующая информация будет опубликована в информационном указателе «Национальные стандарты»
© Стандартинформ, 2006
В Российской Федерации настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии
Содержание
Область применения 1
Нормативные ссылки 1
Определения 1
Символы 2
Точечная оценка пропорции р 2
Доверительные границы для пропорции р 2
Проверка гипотез для пропорции р 3
Общие требования 3
Сравнение пропорции с заданным значением р0 3
Сравнение двух пропорций 4
Формы 5
Формы А. Доверительный интервал для пропорции р 5
Формы В. Сравнение пропорции р с заданным значением р0 8
Формы С. Сравнение двух пропорций 12
Таблицы и номограммы 18
Интерполяция в таблице 4 квантилей F-распределения 18
Пример 18
Приложение А (обязательное) Вычисление оперативной характеристики критерия для формы В. . 33
Приложение В (справочное) Примеры заполненных форм 35
Приложение С (справочное) Сведения о соответствии межгосударственных стандартов ссылочным международным стандартам 45
Приложение D Библиография 45ГОСТ ИСО 11453—2005
МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ
Статистические методы
СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Проверка гипотез и доверительные интервалы для пропорций
Statistical methods. Statistical interpretation of data.
Tests and confidence intervals relating to proportions
Дата введения — 2006—09—01
Область применения
Настоящий стандарт содержит описание статистических методов, предназначенных для решения следующих задач:
Дана совокупность элементов, из которых отобрана выборка из п элементов, йух элементов выборки обнаружена некоторая характеристика. Какая доля (пропорция) совокупности имеет эту характеристику (см. 8.1)?
Отличается ли пропорция, определенная в соответствии с задачей а), от номинального указанного значения (см. 8.2)?
Даны две различные совокупности. Различаются ли доли элементов с заданной характеристикой в этих двух совокупностях (см. 8.3)?
Выборки какого объема следует отбирать для решения задач Ь) и с), чтобы быть достаточно уверенным в правильности решения (см. 7.2.3 и 7.3.3)?
Важно, чтобы метод отбора выборок не оказывал заметного влияния на совокупность. Если взятая случайным образом выборка составляет менее 10 % совокупности, как правило, это является приемлемым. Если выборка составляет более 10 % совокупности, надежные результаты можно получить только возвращая каждый отобранный элемент перед отбором следующего элемента.
Нормативные ссылки
В настоящем стандарте использована нормативная ссылка на следующий стандарт:
ИСО 3534.1:1993 Статистика. Словарь и условные обозначения. Часть 1: Вероятность и основы
статистики
Определения
В настоящем стандарте применены термины по ИСО 3534.1, а также следующий термин с соответствующим определением:
целевой элемент (target item): Элемент, в котором обнаружена указанная характеристика.
Издание официальное
Ри, о
Pi, о
Ри, t
Pl,t
С1, о С и, 0 cl, t
Си, t Ро Р'
FVF2
— тестовые статистики;
4 Символы
В настоящем стандарте использованы следующие символы: а — выбранный уровень значимости;
а' — достигнутый уровень значимости;
(1 — а) — выбранный уровень доверия;
Р — вероятность ошибки второго вида;
л; пу, п2 — объем выборки; объем выборки 1; объем выборки 2;
X — число целевых элементов в выборке (случайная величина); х — значение X;
р — доля (пропорция) целевых элементов совокупности;
верхняя граница одностороннего доверительного интервала для р;
нижняя граница одностороннего доверительного интервала для р;
верхняя граница двустороннего доверительного интервала для р;
нижняя граница двустороннего доверительного интервала для р;
значение, используемое для определения доверительных границ;
критическое значение при проверке нулевой гипотезы Hq. р > Pq,
критическое значение при проверке нулевой гипотезы HQ: р < pQ;
нижняя граница критической области при проверке нулевой гипотезы /70: р = р0;
верхняя граница критической области при проверке нулевой гипотезы Hq. р = р0;
заданное значение для р;
значение р, для которого определяется вероятность неотклонения нулевой гипотезы
Fa>
вероятность неотклонения нулевой гипотезы;
числа степеней свободы F-распределения;
F~ (f^, f2) — квантиль уровня q F-распределения с и f2 степенями свободы;
z<, z2 — тестовые статистики;
иа — квантиль уровня q стандартного нормального распределения; q, г], К — вспомогательные величины.
Точечная оценка пропорции р
Оценку р по выборке из п элементов с х целевыми элементами определяют по формуле
Эта оценка является несмещенной, если выборка отбиралась случайным образом, независимо от объема выборки и размера совокупности, даже если выборка составляетзаметную часть совокупности.
Доверительные границы для пропорции р
Процедуры определения границ доверительного интервала для р приведены в 8.1 (формы А-1—А-3).
Границы доверительного интервала зависят от объема выборки п, числа целевых элементов в выборке х и выбранного уровня доверия (1 — а). Невозможно точно достичь заданного уровня доверия из-за дискретности х. Приведенная в стандарте процедура дает минимальное значение уровня доверия, не превосходящее (1 — а).
В настоящем стандарте при определении границ двустороннего доверительного интервала для заданного уровня доверия (1 — а) используется процедура определения нижних границ одностороннего доверительного интервала для уровня доверия (1 — <х/2). Это гарантирует, что вероятность ошибки меньше или равна а/2 с каждой стороны интервала.
Проверка гипотез для пропорции р
Общие требования
Для решения практических задач в формах В-1 — В-3 (8.2) и С-1 — С-3 (8.3) приведены нулевые гипотезы для пропорций и схемы их проверки. Сначала должны быть выбраны соответствующая нулевая гипотеза, объем выборки п (объемы выборок л1 и л2) и уровень значимости. Поскольку основные используемые распределения дискретны, процедуры разработаны так, чтобы достичь самого близкого к выбранному значению уровня значимости, который меньше или равен этому значению. В формах не приведены альтернативные гипотезы, так как в каждом случае неявно предполагается, что альтернативная гипотеза является дополнительной к нулевой гипотезе.
Пример — При работе с формами В (процедура сравнения пропорции с заданным значением) вначале необходимо выбрать одну из следующих трех нулевых гипотез Но(с дополнительной альтернативной гипотезой НЛ), где р0— заданное значение:
односторонний критерий с Но: р>р0и НД: р < р0;
односторонний критерий с Но: р <р0и Н^: р> р0;
двусторонний критерий с Но: р = р0и НД: р~ pQ.
Результатом проверки гипотезы является отклонение или неотклонение нулевой гипотезы.
Отклонение нулевой гипотезы означает, что принимается альтернативная гипотеза. Неотклонениенулевойгипотезынеозначает, что принимается нулевая гипотеза (см. 7.2.2).
Сравнение пропорции с заданным значением р0
Процедура проверки гипотез
Процедуры проверки нулевых гипотез:
н0- Р> Р0;
Но: Р< ро;
Но- Р = Р0,
гдер0— заданное значение, описаны в формах В-1 — В-3. Эти процедуры особенно просты для применения, если известны критические значения для заданных значений п, р и а. Если критические значения неизвестны, их можно определить при выполнении процедуры в соответствии с формами В (8.2).
Оперативные характеристики
Вычисление оперативных характеристик (включая вероятность ошибки первого рода, достигнутого уровня значимости и вероятности ошибки второго рода) описаны в приложении А. Для вычисления этих характеристик критические значения должны быть известны (см. 7.2.1) и должна быть выбрана альтернативная гипотеза р = р^, для которой пределяется вероятность ошибки второго рода.
Определение объема выборки п
Если объем выборки не определен (например, по экономическим или техническим причинам), его минимальное значение должно быть задано таким, чтобы для выбранной нулевой гипотезы Но (см. 7.2.1) достигнутое значение уровня значимости не превосходило выбранного или заданного значения. Кроме того, достигнутое значение ошибки второго рода (вероятность р) должно быть приблизительно равно выбранному или заданному значению р, если р равно выбранному значению д'. Для этой цели р0 и р' должны быть отмечены на шкале р, а а, (1 — а), а/2, (1 — а/2) — на шкале Р и прямых линиях 1 и 2 в соответствии с таблицей 1 и номограммой Ларсона (рисунок 2).