- если в результате проверки нулевую гипотезу Н 0 нельзя отклонить, то это означает, что имеющиеся выборочные данные не позволяют с достаточной уверенностью отклонить нулевую гипотезу Н 0 , вероятность нулевой гипотезы Н 0 больше, а конкурирующей Н 1 - меньше 1 - ;
- если в результате проверки нулевая гипотеза Н 0 отклоняется в пользу конкурирующей Н 1 , то имеющиеся выборочные данные не позволяют с достаточной уверенностью принять нулевую гипотезу Н 0 , вероятность нулевой гипотезы Н 0 меньше, а конкурирующей Н 1 - больше 1 -.
Глава 2. Проверка различных типов статистических гипотез
2.1 Проверка гипотезы о законе распределения генеральной совокупности с использованием критерия Пирсона
Использование этого критерия основано на применении такой меры (статистики) расхождения между теоретическим F(x) и эмпирическим распределением Fn(x), которая приближенно подчиняется закону распределения. Гипотеза Н 0 о согласованности распределений проверяется путем анализа распределения этой статистики. Применение критерия требует построения статистического ряда. (Приложение 1).
Пример 1. В 7 случаях из 10 фирма-конкурент компании «А» действовала на рынке так, как будто ей заранее были известны решения, принимаемые фирмой «А». На уровне значимости 0,05 определите, случайно ли это, или в фирме «А» работает осведомитель фирмы-конкурента?
Решение. Для того чтобы ответить на поставленный вопрос, необходимо проверить статистическую гипотезу о том, совпадает ли данное эмпирическое распределение числа действий фирмы-конкурента с равномерным теоретическим распределением?
Если ходы, предпринимаемые конкурентом, выбираются случайно, т. е. в фирме «А» - нет осведомителя (инсайдера), то число «правильных» и «неправильных» ее действий должно распределиться поровну, т. е. по 5 (10/2), а это и есть отличительная особенность равномерного распределения.
Этот вид статистических гипотез относится к гипотезам о виде закона распределения генеральной совокупности.
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н 0 : X ~ R(а; b) - случайная величина X подчиняется равномерному распределению с параметрами (а; b) (в контексте задачи - «В фирме «А» -нет осведомителя (инсайдера)»; «Распределение числа удачных ходов фирмы-конкурента - случайно»);
Н 1 : случайная величина X не подчиняется равномерному распределению (в контексте задачи - «В» фирме «А» - есть осведомитель (инсайдер)»; «Распределение числа удачных ходов фирмы-конкурента - неслучайно»).
В качестве критерия для проверки статистических гипотез о неизвестном законе распределения генеральной совокупности используется случайная величина %2. Этот критерий называют критерием Пирсона.
Его наблюдаемое значение (c2 набл ) рассчитывается по формуле
где m(эмп) i - эмпирическая частота i-й группы выборки; m(теор) i - теоретическая частота i-й группы выборки.
Составим таблицу распределения эмпирических и теоретических частот (таблица 2).
Таблица 2
|
m(эмп) i |
7 |
3 |
|
|
m(теор) i |
5 |
5 |
Найдем наблюдаемое значение 2 набл
Критическое значение (2 кр ) следует определять с помощью таблиц распределения 2 по уровню значимости и числу степеней свободы k .
По условию = 0,05, а число степеней свободы рассчитывается по формуле
k = n - l - 1
где k - число степеней свободы; n - число групп выборки; l - число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки (если все параметры предполагаемого закона известны точно, то l = 0).
По условию задачи, число групп выборки (n ) равно 2, так как могут быть только 2 варианта действий фирмы-конкурента: «удачные» и «неудачные», а число неизвестных параметров равномерного распределения (l ) равно 0.
Отсюда k = 2- 0-1 = 1.
Найдем 2 кр по уровню значимости а = 0,05 и числу степеней свободы k = 1:
2 кр( a =0,05; k =1) =3,8
2 набл < 2 кр , следовательно, на данном уровне значимости нулевую гипотезу нельзя отклонить, расхождения эмпирических и теоретических частот - незначимые. Данные наблюдений согласуются с гипотезой о равномерном распределении генеральной совокупности.
Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет оснований и на уровне значимости = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.
Ответ. На уровне значимости = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.
Пример 2. На уровне значимости = 0,025 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты (табл. 3):
Таблица 3
|
m(эмп) i |
5 |
10 |
20 |
25 |
14 |
3 |
|
|
m(теор) i |
6 |
14 |
28 |
18 |
8 |
3 |
Решение
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н 0 : X ~ N ( 2 ) - случайная величина X подчиняется нормальному закону распределения с параметрами и 2 .
Н 1 : случайная величина X не подчиняется нормальному закону распределения с параметрами и 2 .
В качестве критерия для проверки нулевой гипотезы используем критерий Пирсона 2 Найдем наблюдаемое значение (2 набл ):
Найдем критическое значение критерия (2 кр ) по таблице распределения 2 кр по уровню значимости и числу степеней свободы k .
По условию = 0,025; число степеней свободы найдем по формуле
k = n - l - 1
где k - число степеней свободы; n - число групп выборки; l -число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки.
По условию задачи число групп выборки (n ) равно 6, а число неизвестных параметров нормального распределения (l ) равно 2.
Отсюда k = 6- 2-1 = 3.
Найдем 2 кр по уровню значимости = 0,025 и числу степеней свободы k = 3:
2 кр (=0,025; k =3) = 9,4
2 набл > 2 кр , следовательно, на данном уровне значимости нулевая гипотеза отклоняется в пользу конкурирующей, расхождения эмпирических и теоретических частот - значимые. Данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.
Ответ. На уровне значимости = 0,025 данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.
2.2 Проверка гипотезы с неизвестной дисперсией генеральной совокупности согласно критерию Стьюдента
Цель использования критерия Стьюдента - выявление достоверности различия между данными двух выборок одной и той же генеральной совокупности
Метод Стьюдента применяется для сравнения двух выборок, взятых из одной и той же генеральной совокупности, или двух различных состояний одной и той же выборочной совокупности.
При этом могут представиться следующие случаи:
1. По объему:
а) обе группы большие (n>30);
б) обе группы малые ;
в) одна - большая, вторая - малая.
2. По составу:
а) группы с попарно-зависимыми вариантами, когда i- варианта первой группы сравнивается с i- вариантой второй группы ;
б) группы с попарно-независимыми вариантами (можно менять варианты местами внутри группы).
Пример. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения времени выполнения этой технологической операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции X = 42 с. Можно ли по имеющимся хронометрическим данным на уровне значимости = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если:
а) исправленное выборочное среднее квадратическое отклонение s - 3,5 с;
б) выборочное среднее квадратическое отклонение 3,5 с?
Решение, а) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н 0 : а = а0 = 40 - неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению а0 (применительно к условию данной задачи - время выполнения технологической операции соответствует норме).
Н 1 : а > 40 - неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения а0 (применительно к условию данной задачи - время выполнения технологической операции больше установленной нормы).
Так как конкурирующая гипотеза - правосторонняя, то и критическая область - правосторонняя.
В качестве критерия для сравнения неизвестного математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значением а0 используется случайная величина t -критерий Стьюдента. (Приложение 2).
Его наблюдаемое значение (t набл ) рассчитывается по формуле
где X - выборочная средняя; а0 - числовое значение генеральной средней; s - исправленное среднее квадратическое отклонение; n - объем выборки.
Найдем наблюдаемое значение t набл
Критическое значение (t кр ) следует находить с помощью таблиц распределения Стьюдента (приложение 2) по уровню значимости и числу степеней свободы k .
По условию = 0,01; число степеней свободы найдем по формуле
k = n - 1,
где k - число степеней свободы; n- объем выборки.
k = 16 - 1 = 15.
Найдем t кр по уровню значимости = 0,01 (для односторонней критической области) и числу степеней свободы k = 15:
t кр( =_--,_1; k =15) = 2,6
Заметим, что при левосторонней конкурирующей гипотезе Н1 :а < 40t кр следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости (для односторонней критической области) и числу степеней свободы k = n - 1 и присваивать ему знак «минус».
При двусторонней конкурирующей гипотезе Н1 : а?40 t следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости а (для двусторонней критической области) и числу степеней свободы k = n - 1.
t набл < t кр следовательно, на данном уровне значимости нет оснований отклонить нулевую гипотезу.
Ответ. По имеющимся хронометрическим данным на уровне значимости а = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме. Следовательно, жалобы работниц - необоснованны.
Наблюдаемое значение критерия попадает в область допустимых значений (рисунок 4), следовательно, нет оснований отклонить нулевую гипотезу.
Рисунок 4
б) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна.
Алгоритм решения задачи будет тот же, что и в первом случае. Однако наблюдаемое значение t набл рассчитывается по формуле
где X - выборочная средняя; а0 - числовое значение генеральной средней; выб - выборочное среднее квадратическое отклонение; n- объем выборки.
Найдем наблюдаемое значение (t набл )
Критическое значение (t кр ) следует находить находить по таблице распределения Стьюдента (приложение 2) по уровню значимости а и числу степеней свободы k .
t набл < t кр , следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу, жалобы работниц - необоснованны.
Ответ. По имеющимся хронометрическим данным на уровне значимости а = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, жалобы работниц - необоснованны.
2.3 Проверка гипотезы о законе распределения генеральной совокупности с использованием функции Лапласа
Пример. Экономический анализ труда предприятий отрасли позволил выдвинуто гипотезу о наличии 2 типов предприятий с различной средней величиной показателя производительности труда. Выборочное обследование 42 предприятий 1-й группы дало следующие результаты: средняя производительность труда X - 119 деталей. По данным выборочного обследования, на 35 предприятиях 2-й группы средняя производительность труда Y - 107 деталей. Генеральные дисперсии известны:
D(Х ) = 126,91 (дет.2 ); D(Y) = 136,1 (дет.2 ).
Считая, что выборки извлечены из нормально распределенных генеральных совокупностей X и Y, на уровне значимости 0,05, проверьте, случайно ли полученное различие средних показателей производительности труда в группах или же имеются 2 типа предприятий с различной средней величиной производительности труда.
Решение. Для решения данной задачи необходимо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны (большие независимые выборки). В данной задаче речь идет о больших выборках, так как nх = 42 и nу = 35 больше 30. Выборки - независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.