3) величине средней арифметической и доли;
4) наличии и тесноте связи между изучаемыми признаками;
5) о форме корреляционной связи.
При проверке гипотез имеется возможность совершить ошибку двоякого рода:
а) ошибка первого рода - проверяемая гипотеза (нулевая гипотеза Н0 ) является в действительности верной, но результаты проверки приводят к отказу от нее;
б) ошибка второго рода - проверяемая гипотеза в действительности является ошибочной, но результаты проверки приводят к принятию.
В статистике в настоящее время имеется большое число критериев для проверки практически любых гипотез. Притом основные принципы их построения и применения являются общими. Для построения статистического критерия, позволяющего проверить некоторую гипотезу, необходимо следующее:
1) сформулировать проверяемую гипотезу Н0 . Наряду с проверяемой гипотезой формулируется также конкурирующая (альтернативная) гипотеза;
2) выбрать уровень значимости, контролирующий допустимую вероятность ошибки первого рода;
3) определить область допустимых значений и так называемую критическую область;
4) принять то или иное решение на основе сравнения фактического и критического значений критерия.
Проверка статистических гипотез складывается из следующих этапов:
- формулируется в виде статистической гипотезы задача исследования;
- выбирается статистическая характеристика гипотезы;
- выбираются испытуемая и альтернативная гипотезы на основе анализа возможных ошибочных решений и их последствий;
- определяются область допустимых значений, критическая область, а также критическое значение статистического критерия (t, F) по соответствующей таблице;
- вычисляется фактическое значение статистического критерия;
- проверяется испытуемая гипотеза на основе сравнения фактического и критического значений критерия, и в зависимости от результатов проверки гипотеза либо отклоняется, либо не отклоняется.
Уровнем значимости будет называться такое малое значение вероятности попадания критерия в критическую область при условии справедливости гипотезы, что появление этого события может расцениваться как следствие существенного расхождения выдвинутой гипотезы и результатов выборки. Обычно уровень значимости принимают равным 0,05 или 0,01. Исходя из величины уровня значимости, можно определить критическую область, под которой понимается такая область значений выборочной характеристики, попадая в которую они будут свидетельствовать о том, что проверяемая гипотеза должна быть отвергнута. К критической области относятся те значения, появление которых при условии верности гипотезы было бы маловероятным.
Допустим, что рассчитанное по эмпирическим данным значение критерия попало в критическую область, тогда при условии верности проверяемой гипотезы Н0 вероятность этого события будет не больше уровня значимости. Поскольку выбирается достаточно малым, то такое событие является маловероятным и, следовательно, проверяемая гипотеза Н0 может быть отвергнута.
Если же наблюдаемое значение характеристики не принадлежит к критической области и, следовательно, находится в области допустимых значений, то проверяемая гипотеза Н0 не отвергается. Вероятность попадания критерия в область допустимых значений при справедливости проверяемой гипотезы Н0 равна 1.
Чем меньше уровень значимости, тем меньше вероятность браковать проверяемую гипотезу, когда она верна, т.е. меньше вероятность совершить ошибку первого рода. Но при этом расширяется область допустимых значений и, значит, увеличивается вероятность совершения ошибки второго рода.
Все значения рассматриваемой характеристики, не принадлежащие к критической области образуют так называемую область допустимых значений. Если наблюдаемое значение характеристики находится в области допустимых значений, то проверяемая гипотеза принимается с вероятностью.
Выбор критерия для проверки статистических гипотез может осуществляться на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f ( k ) при условии справедливости гипотезы Н 0 , чтобы при заданном условии значимости ?можно было бы найти критическую точку К кр распределения f ( k ), которая распределила бы область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н 0 .
Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости ?рассчитать по выборочным данным наблюдаемое значение критерия К набл и определить, является ли оно наиболее или наименее правдоподобным в отношении нулевой гипотезы Н 0 .
Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае.
Как уже отмечалось ранее, проверка статистических гипотез применяется в разных областях для изучения массовых явлений. Изучение массовых явлений, как правило, осуществляется по неполной информации. В составе собранных данных могут встречаться единичные наблюдения, у которых отдельные значения изучаемых признаков заметно отличаются от общей тенденции изменения большинства значений. Причины таких отличий могут быть разными:
1) из-за ошибок наблюдения;
2) вследствие случайного стечения различных обстоятельств, каждый из которых в отдельности несущественный, но совокупное их влияние привело к таким резко выделяющимся от общей картины значениям признаков;
3) как следствие нарушения однородности изучаемой совокупности.
В общем случае все значения изучаемых признаков фиксируются по известным единицам совокупности по их части, отобранной с учетом всех требований. Следовательно, первичные статистические данные, включая и резко «выделяющемся», соответствуют конкретным случаям проявления изучаемого явления.Следовательно, субъективное отбрасывание «выделяющихся» единиц недопустимо.
Рассмотрим использование критериев для проверки статистических гипотез на примере закона нормального распределения. Закон нормального распределения лежит в основе многих теорем и методов статистики
- при оценке репрезентативности выборки (расчете ошибки выборки и распространении характеристик выборки на генеральную совокупность);
- измерении степени тесноты связи и составлении модели регрессии;
- построении и использование статистических критериев и др.
Как показывают многочисленные статистические исследования, частоты (частости) эмпирических распределений за редким исключением будут отличаться от значений теоретического распределения. Расхождения между частотами (частостями) эмпирического и теоретического распределения могут быть несущественными и объяснены случайностями выборки и существенными при несоответствии выбранного и эмпирического законов распределения.
Для проверки гипотезы о соответствии эмпирического распределения теоретическому закону нормального распределения используются особые статистические показатели-критерии согласия (или критерии соответствия). К ним относятся критерии К.Пирсона, А.Н. Колмогорова, Романовского, Ястремского и др.
Большинство критериев согласия базируется на использовании отклонений эмпирических частот от теоретических. Очевидно, что чем больше эти отклонения, тем хуже теоретическое распределение соответствует эмпирическому. Статистические характеристики таких критериев согласия являются некоторыми функциями этих отклонений.
1.3 Основные принципы расчета критериев для проверки статистических гипотез
Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным для в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона 2 ; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей - с помощью критерия Фишера F ; ряд гипотез о неизвестных значениях параметров генеральных совокупностей проверяется с помощью критерия Z - нормальной распределенной случайной величины и критерия t -Стьюдента и т. д.
Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия (К набл. ).
Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы Н 0 ) и критическую область (область значений, менее правдоподобных в отношении нулевой гипотезы Н 0 ), определяемые на заданном уровне значимости а по таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками (К кр ).
Областью допустимых значений (областью принятия нулевой гипотезы Н 0 ) называют совокупность значений критерия К , при которых нулевая гипотеза Н 0 не отклоняется.
Критической областью называют совокупность значений критерия К , при которых нулевая гипотеза Н 0 отклоняется в пользу конкурирующей Н 1 .
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.
Если конкурирующая гипотеза - правосторонняя, например, Н 1 : а > а0 , то и критическая область правосторонняя (рисунок 1). При правосторонней конкурирующей гипотезе критическая точка (К кр.п ) принимает положительные значения.
Рисунок 1
Если конкурирующая гипотеза - левосторонняя, например, Н 1 : а < а0 , то и критическая область - левосторонняя (рисунок 2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения (Ккр.л ).
Рисунок 2.
Если конкурирующая гипотеза - двусторонняя, например, Н 1 : а=а0 , то и критическая область - двусторонняя (рисунок 3). При двусторонней конкурирующей гипотезе определяются 2 критические точки (Ккр.л и Ккр.п ).
Рисунок 3
Основной принцип проверки статистических гипотез состоит в следующем:
- если наблюдаемое значение критерия (Кнабл ) принадлежит критической области, то нулевая гипотеза Н 0 отклоняется в пользу конкурирующей;
- если наблюдаемое значение критерия (Кнабл ) принадлежит области допустимых значений, то нулевую гипотезу Н 0 нельзя отклонить.
Можно принять решение относительно нулевой гипотезы Н 0 путем сравнения наблюдаемого (Кнабл ) и критического значений критерия (Ккр ).
При правосторонней конкурирующей гипотезе:
- если Кнабл < Ккр , то нулевую гипотезу Н 0 нельзя отклонить;
- если Кнабл > Ккр , то нулевая гипотеза Н 0 отклоняется в пользу конкурирующей Н 1 .
При левосторонней конкурирующей гипотезе:
- если Кнабл > - Ккр , то нулевую гипотезу Н 0 нельзя отклонить;
- если Кнабл < - Ккр , то нулевая гипотеза Н 0 отклоняется в пользу конкурирующей Н1 .
При двусторонней конкурирующей гипотезе:
- если - Ккр < Кнабл < Ккр , то нулевую гипотезу Н 0 нельзя отклонить;
- если Кнабл > Ккр или Кнабл < -Ккр , то нулевая гипотеза Н 0 отклоняется в пользу конкурирующей Н 1 .
Алгоритм проверки статистических гипотез сводится к следующему:
1) сформулировать нулевую Н 0 и альтернативную Н 1 гипотезы;
2) выбрать уровень значимости ;
3) в соответствии с видом выдвигаемой нулевой гипотезы Н 0 выбрать статистический критерий для ее проверки, т.е. - специально подобранную случайную величину К точное или приближенное распределение которой заранее известно;
4) по таблицам распределения случайной величины К , выбранной в качестве статистического критерия, найти критическое значение К (критическую точку или точки);
5) на основании выборочных данных по специальному алгоритму вычислить наблюдаемое значение критерия Кнабл ;
6) по виду конкурирующей гипотезы Н 1 определить тип критической области;
7) определить, в какую область (допустимых значений или критическую) попадает наблюдаемое значение критерия Кнабл , и в зависимости от этого -принять решение относительно нулевой гипотезы Н 0 .
Следует заметить, что даже в том случае, если нулевую гипотезу Н 0 нельзя отклонить, это не означает, что высказанное предположение о генеральной совокупности является единственно подходящим: просто ему не противоречат имеющиеся выборочные данные, однако таким же свойством наряду с высказанной могут обладать и другие гипотезы.
Можно интерпретировать результаты проверки нулевой гипотезы следующим образом: