Материал: 3744

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

В стандартном научном подходе проверки гипотез исследователь пытается показать несостоятельность нулевой гипотезы, несогласованность еѐ с имеющимися опытными данными, то есть отвергнуть гипотезу. При этом подразумевается, что должна быть принята другая, альтернативная (конкурирующая), исключающая нулевую, гипотеза.

Этапы проверки гипотезыН0.

1.Формулируется проверяемая гипотеза Н0

2.Выбирается критерий проверки X. Критерий – это величина, закон распределения которой при условии справедливости проверяемой гипотезы известен.

3.Выбирается уровень значимости и критическая область Q, так, чтобы условная вероятность попадания критерия в Q при условии справедливости гипотезы равнялась .

4.Выполняем эксперимент и находим экспериментальное значение критерия Х.

5.Если критерий X не попадает в критическую область Q, гипотеза принимается, если XQ – то отвергается.

Выбор критической области должен производиться с учетом смысла гипотезы; следует учитывать, что если Х попадает в критическую область, то гипотеза будет отвергнута

Методы проверки гипотез

Существует два различных метода проверки гипотез. Первый – метод доверительных интервалов. Второй метод носит название t-тест, который более распространен на практике, и основан на расчете t-статистики.

Проверка гипотезы заключается в сравнении двух известных величин Х и

μ0,

где μ – неизвестное среднее значение генеральной совокупности (которое нас интересует);

μ0 – заданное значение, в отношении которого проверяют гипотезу; Х – среднее значение выборки (случайная величина), которое

представляет μ.

16

Если эти значения Х и μ0 «достаточно близки» между собой (Х = μ0), то принимается нулевая гипотеза. Если значения «сильно отличаются» друг от друга (Х ≠ μ0), то принимается альтернативная гипотеза. «Близость» значений определяется на основе значения стандартной ошибкой Sx.

Метод «доверительных интервалов» заключается в построении диапазона значений на 95% уровне достоверности (см. таблицу ниже):

Для среднего

 

 

 

X - t*SХ ≤µ≤ X + t*SХ

 

 

 

 

 

 

 

 

 

 

 

Для доли

 

 

 

ρ - t*Sр ≤π ≤ ρ + t*Sр

признака

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Стандартная

SХ =

 

 

 

σ – ст. отклонение

ошибка среднего

 

 

 

 

 

 

n - объем выборки

 

n

 

 

 

 

 

 

 

 

Стандартная

 

 

 

 

 

 

 

 

 

ρ - доля изучаемого

Sр=

р(1- р)

 

 

ошибка доли

 

 

 

 

 

 

 

признака

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если значениеμ0 находится за пределами доверительного интервала, то оно не может рассматриваться как возможное значение, т.е. равенство μ = μ0 не выполняется. Соответственно, выполняется условие μ ≠ μ0 , т.е. доказывается альтернативная гипотеза. В таком случае делается вывод о том, что нулевая гипотеза отклоняется и принимается альтернативная гипотеза на уровне достоверности 95%.

Метод «t – тест» заключается в расчете критерия Стьдента или t –

статистики, сравнении ее с табличным значением и формулировкой вывода. Коэффициент Стьюдента или t-статистику предложил В.С. Госсет (см.

таблицу ниже):

17

Для среднего

t

X

S x

 

 

 

 

t

 

 

Для доли признака

 

 

 

S

 

 

 

 

 

 

 

Для сравнения с табличным значением используется абсолютное

значение t, т.е. «по модулю».

 

 

 

 

Критерий Стьюдента или t - статистика показывает на сколько стандартных ошибок отличаются между собой средние значения по выборке (Х) и генеральной совокупности (μ). Поскольку при 95% уровне достоверности значение t =1,96, то существует эмпирическое правило, что «приt>2 нулевая гипотеза отклоняется».

Считается, что результат проверки является статистически значимым, если альтернативная гипотеза принимается на уровне 5%. Для описания полученных результатов обычно пользуются следующими терминами:

Незначимый

 

Отсутствие значимости на уровне 5%

Значимый

 

Значимость на уровне 5%

Высоко значимый

Значимость на уровне 1%

Очень

высоко

Значимость на уровне 0,01%

значимый

При расчетах в Excel программа выводит р-значение, которое показывает вероятность того, что данные соответствуют нулевой гипотезе. Обычно Н0 отклоняют, если р < 0,05. Другими словами, вероятность того, что нулевая гипотеза истинна, не превышает 5% (что является статистически значимым).

Сравнение двух независимых выборок с применением t- критерия

Для двух несвязанных выборок(наблюдения не относятся к одной и той же группе объектов ) возможны два варианта расчета:

когда дисперсии известны

когда дисперсии неизвестны, но равны друг другу.

18

1.Предварительно проверяется нормальность закона распределения по одному из критериев согласия.

2.Рассчитывается средне арифметические значения X иY для каждой выборки по формуле

X1 n xi

n i 1

где xi – значение i-го результата наблюдения.

3.Рассчитывается tэмп - эмпирическое значение критерия Стьюдента:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

X

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sd

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Sd

Sx2 S y2

, здесь S x

2

и S y

2

 

 

– оценки дисперсий.

Равночисленные выборки . В этом случае n1 n2 n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi x 2 yi

y 2

 

S

 

 

 

S 2 S

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1 n

 

 

 

 

 

 

 

d

 

 

 

x

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В случае на равночисленных выборок n1 n2 , выражение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi x 2 yi y 2

n n

 

 

 

 

 

 

 

 

S 2

S 2

 

2

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

d

 

 

 

 

 

 

n1 n2 2

 

 

 

 

 

 

 

 

 

x

y

 

 

 

 

 

 

 

 

n1n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В обоих случаев подсчет числа степеней свободы осуществляется по формулам

df (n1 1) (n2 1) n1 n2 2

При численном равенстве выборок 2n 2

4.Эмпирическое значение t'эмп критерия Стьюдента сравнивается с

критическим значением t'кр (по таблице 1 приложения) для данного числа степеней свободы.

Нулевая гипотеза H0 при заданном уровне значимости принимается,

если эмпирическое значение t'эмп. tкр .

19

Сравнение двух зависимых выборок с применением t- критерия

Под связанными выборками понимаются наблюдения для одной группы объектов, причем все наблюдения попарно связаны с каждый объектом исследования и характеризуют его состояние до воздействия и после воздействия некоторого фактора.

Гипотезы

H 0 : среднее значение в выборке не отличается от нуля.

H1 : среднее значение в выборке отличается от нуля.

Данные в выборке измерены по шкале интервалов или по шкале отношений. Сравниваемых выборок две для оной группы объектов наблюдения, причем имеет место парность наблюдений в выборках.

1.Предварительно проверяется нормальность закона распределения по одному из критериев согласия.

2.Рассчитывается i xi yi (i=1..n) – попарные разности вариант, xi и

yi результаты измерений для i-го объекта до и после воздействия некоторого фактора. Величину i будем считать независимой для разных объектов и нормально распределенной

3.Рассчитываются (лучше в табличной форме): сумма попарных

n

n

 

разностей i

и вспомогательные параметры i

2

i 1

i 1

 

 

n

 

2

и

i .

i 1

 

 

4.Рассчитывается týěď - эмпирическое значение критерия (n 1)

степенями свободы по формуле

 

 

 

 

n

 

 

 

 

 

t

i

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

n

 

 

 

 

 

 

 

n i 2 ( i )2

 

 

 

i 1

i 1

 

 

 

 

 

 

 

 

n 1

 

 

 

 

где n – численность выборки.

 

 

 

 

 

5.Найденное

эмпирическое значение

t'эмп критерия Стьюдента

сравнивается с критическим значением

t'кр (по

таблице 1 приложения) для

данного числа степеней свободы.

Нулевая гипотеза H 0 при заданном уровне значимости принимается, если эмпирическое значение t'ýěď . tęđ .

20