(13)
Статистической
называют
гипотезу (предположение) о виде
неизвестного теоретического распределения
или о параметрах известного распределения.
Выдвигаемую гипотезу называют нулевой
или основной и обозначают
.
Гипотезу, которая противоречит основной,
называют конкурирующей или альтернативной
и обозначают
. Методы проверки гипотез в математической
статистике называют критериями.
Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Рассмотрим
критерий
Пирсона
или критерий
(хи-квадрат). Его достоинство состоит в
том, что он не критичен к типу проверяемого
распределения. В основе критерия положено
сравнение наблюдаемых (эмпирических)
и теоретических (рассчитанных согласно
предполагаемому распределению) частот.
Пусть по выборке получено статистическое распределение:
|
|
|
|
… |
|
|
|
|
|
… |
|
где
– представители интервала,
– частоты вариант. Выдвигаем гипотезу
,
состоящую в том, что изучаемый признак
имеет конкретный тип распределения, и
записываем функцию распределения
.
Определяем параметры закона и рассчитываем
теоретические частоты
для каждого интервала, используя
функцию распределения
[2]:
(14)
(15)
где
– теоретическая вероятность попадания
варианты в
-ый
интервал,
и
– границы
-го
интервала. В качестве меры близости
теоретического и статистического
распределений в случае критерия Пирсона
предлагается брать сумму нормированных
разностей между частотами
и
,
возведя их предварительно в квадрат
для устранения возможности взаимного
погашения положительных и отрицательных
значений. Полное обоснование критерия
Пирсона дается в [2].
Таким образом, для выборки рассчитывается сумма
(16)
где
– число интервалов группированной
выборки. Значение
зависит от выборки и, следовательно,
является случайной величиной. Чем меньше
,
тем лучше согласуются статистическое
(эмпирическое) и теоретическое
распределения. Гипотеза
,
утверждающая, что изучаемый признак
имеет указанное теоретическое
распределение, согласуется с результатами
на уровне значимости
,
если
(17)
и
гипотеза
отклоняется, если
(18)
где
– критическое значение. Для определения
критического (или граничного) значения
существуют специальные таблицы
распределения (прил. 4)
.
Пирсон
доказал, что при
закон распределения случайной величины
(16), независимо от того, какому распределению
подчинена генеральная совокупность,
стремится к закону распределения
хи-квадрат с
-степенями
свободы. При этом число степеней свободы
находится как,
,
где
-
число интервалов группированной выборки,
– число параметров теоретического
распределения. В частности, если
предполагаемое распределение –
нормальное или равномерное, то
(19)
для показательного распределения
(20)
Уровень
значимости
есть вероятность, с которой основная
гипотеза
по
результатам проверки (17) будет отвергнута.
Она выбирается или задается предварительно.
Для
расчета значения
по группированной выборке составляют
табл. 3. При этом следует обратить
внимание, чтобы в каждый интервал
группированной выборки попало не меньше
6 значений вариант. Если это условие
нарушено, то следует или изменить границы
интервалов, или объединить соседние.
По заданному
и найденному числу степеней свободы
из прил. 4 находится
;
проверяется неравенство (17). Если оно
выполняется, то гипотеза о выбранном
теоретическом распределении изучаемого
признака принимается, в противном случае
отвергается и следует выдвинуть новую
гипотезу или проверить правильность
выбора интервалов группированной
выборки.
Таблица 3
Расчет
значения
![]()
|
№ |
Первая граница интервала
|
Вторая граница интервала
|
Час- тоты
|
Теоретическая вероятность
|
|
|
|
|
1.
.. k |
…
|
|
…
|
…
|
…
|
…
|
…
|
|
∑ |
|
|
100 |
|
|
|
|