Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н 0 : X = Y - генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями равны (применительно к условию данной задачи - предприятия 2 групп относятся к одному типу предприятий: средняя производительность труда в 2 группах - одинакова).
Н 1 : X? Y- генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями неравны (применительно к условию данной задачи - предприятия 2 групп относятся к разному типу предприятий: средняя производительность труда в 2 группах - неодинакова).
Выдвигаем двустороннюю конкурирующую гипотезу, так как из условия задачи не следует, что необходимо выяснить больше или меньше производительность труда в одной из групп предприятий по сравнению с другой.
Поскольку конкурирующая гипотеза - двусторонняя, то и критическая область - двусторонняя.
В качестве критерия для сравнения 2 средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), используется случайная величина Z .
Его наблюдаемое значение (Z набл ) рассчитывается по формуле
где X - выборочная средняя для X ; Y- выборочная средняя для Y; 1>(Х ) - генеральная дисперсия для X; D ( Y ) - генеральная дисперсия для Y; пх - объем выборки для X ; пу - объем выборки для Y .
Найдем наблюдаемое значение (z набл ):
Так как конкурирующая гипотеза - двусторонняя, критическое значение (z кр ) следует находить по таблице функции Лапласа (приложение 3) из равенства
Ф(z кр )= (1)
По условию = 0,05.
Отсюда
Ф0 (z кр )=(1-0,05) /2 = 0,475.
По таблице функции Лапласа (приложение 3) найдем, при каком (z кр ) Ф0 (z кр )=0,475.
Ф0 (1,96) = 0,475.
Учитывая, что конкурирующая гипотеза - двусторонняя, находим две критические точки:
z кр( n ) = 1,96; z кр(л) = -1,96
Заметим, что при левосторонней конкурирующей гипотезе Н 1 : X < Yz кр следует находить по таблице функции Лапласа (приложение 3) из равенства Ф0 (z кр ) = (1 - 2)/2 и присваивать ему знак «минус».
При правосторонней конкурирующей гипотезе Н1 : X > Yz кр находим по таблице функции Лапласа (приложение 3) из равенства Ф0 (z кр ) = (1 - 2)/2.
Z набл > z кр , следовательно, на данном уровне значимости нулевая гипотеза отвергается в пользу конкурирующей. На уровне значимости = 0,05 можно утверждать, что полученное различие средних показателей производительности труда в группах неслучайно, имеются 2 типа предприятий с различной средней величиной производительности труда.
Наблюдаемое значение критерия попадает в критическую область (рисунок 5), следовательно, нулевая гипотеза отклоняется в пользу конкурирующей.
Рисунок 5
Ответ. На уровне значимости = 0,05 можно утверждать, что полученное различие средних показателей производительности труда в группах неслучайно, имеются 2 типа предприятий с различной средней величиной производительности труда.
2.4 Проверка гипотезы о законе распределения генеральной совокупности с использованием критерия Фишера-Снедекора
Пример. Предполагается, что применение нового типа резца сократит время обработки некоторой детали. Хронометраж времени обработки 9 деталей, обработанных старым типом резцов, дал следующие результаты: среднее время обработки детали X - 57 мин, исправленная выборочная дисперсия s2 х = 186,2 (мин2 ). Среднее время обработки 15 деталей, обработанных новым типом резцов, - Y по данным хронометражных измерений - 52 мин, а исправленная выборочная дисперсия s2 х = 166,4 (мин2 ). На уровне значимости = 0,01 ответьте на вопрос, позволило ли использование нового типа резцов сократить время обработки детали?
Решение. Для решения данной задачи необходимо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых неизвестны, но предполагаются одинаковыми (малые независимые выборки). В этой задаче речь идет о малых выборках, так как nх = 9 и nу = 15 меньше 30. Выборки - независимые, поскольку из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н0 :X = Y- генеральные средние 2 нормально распределенных совокупностей с неизвестными дисперсиями (но предполагаемыми одинаковыми) равны (применительно к условию данной задачи -среднее время, затрачиваемое на обработку детали резцами нового и старого типа, - одинаково, т. е. использование нового типа резца не позволяет снизить время на обработку детали).
Н1 : X > Y- генеральная средняя для X больше, чем генеральная средняя для Y (применительно к условию данной задачи - среднее время, затрачиваемое на обработку детали резцами старого типа, больше, чем - нового, т. е. использование нового типа резца позволяет снизить время на обработку детали).
Так как конкурирующая гипотеза - правосторонняя, то и критическая область - правосторонняя.
Приступать к проверке гипотезы о равенстве генеральных средних 2 нормально - распределенных совокупностей с неизвестными дисперсиями можно лишь в том случае, если генеральные дисперсии равны. В противном случае, данная задача в теории неразрешима.
Поэтому, прежде чем проверять эту гипотезу, проверим гипотезу о равенстве генеральных дисперсий нормальных совокупностей.
Сформулируем нулевую и конкурирующую гипотезы, согласно условию задачи.
Н0 : D(Х)=D(Y) - генеральные дисперсии 2 нормально распределенных совокупностей равны.
Н0 : D(Х) >D(Y) - генеральная дисперсия для X больше генеральной дисперсии для У. Выдвигаем правостороннюю конкурирующую гипотезу, так как исправленная выборочная дисперсия для X значительно больше, чем исправленная выборочная дисперсия для Y.
Так как конкурирующая гипотеза - правосторонняя, то и критическая область - правосторонняя.
В качестве критерия для сравнения 2 дисперсий нормальных генеральных совокупностей используется случайная величина Р - критерий Фишера-Снедекора (приложение 4).
Его наблюдаемое значение (f набл ) рассчитывается по формуле
где s- большая (по величине) исправленная выборочная дисперсия; s2 - меньшая (по величине) исправленная выборочная дисперсия.
Найдем f набл
Критическое значение (f кр ) следует находить с помощью таблицы распределения Фишера-Снедекора (приложение 4) по уровню значимости и числу степеней свободы k и k 2 .
По условию а = 0,01; число степеней свободы найдем по формуле
k 1 = n1 - 1; k 2 = n2 - 1,
где k 1 - число степеней свободы большей (по величине) исправленной дисперсии; k 2 - число степеней свободы меньшей (по величине) исправленной дисперсии; n1 - объем выборки большей (по величине) исправленной дисперсии; n2 - объем выборки меньшей (по величине) исправленной дисперсии.
Найдем k 1 и k 2
k 1 = 10 - 1 = 9;
k 2 = 15 - 1 = 14.
Определяем f кр по уровню значимости = 0,01 и числу степеней свободы k 1 =9 и k 2 =14:
f кр( = 0,01; k 1 =9; k 2 =14)
f набл < f кр следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей.
Следовательно, Можно приступить к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей.
Найдемt набл
Критическое значение (t кр ) следует находить по таблице распределения Стьюдента (приложение 2) по уровню значимости и числу степеней свободы k .
По условию = 0,01; число степеней свободы найдем по формуле
k = nх + ny - 2,
де k - число степеней свободы; nх - объем выборки для X; ny - объем выборки для Y.
k = 9 + 15 - 2 = 22.
Найдем t кр по уровню значимости = 0,01 (для односторонней критической области) и числу степеней свободы k = 22
Заметим, что при левосторонней конкурирующей гипотезе X < Yt кр следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости (для односторонней критической области) и числу степеней свободы k = nх + ny - 2 и присваивать ему знак «минус».
При двусторонней конкурирующей гипотезе Х?Yt кр находим по таблицам распределения Стьюдента (приложение 3) по уровню значимости (для двусторонней критической области) и числу степеней свободы k = nх + ny - 2.
t набл < t кр следовательно, на этом уровне значимости нет оснований отвергнуть нулевую гипотезу.
По имеющимся хронометрическим данным на уровне значимости а = 0,01 нельзя отклонить гипотезу о том, что генеральные средние равны, т. е. среднее время, затрачиваемое на обработку детали старым и новым типом резцов, отличается незначимо, расхождения между средними - случайны, использование нового типа резцов не позволяет снизить время обработки детали.
Наблюдаемое значение критерия попадает в область допустимых значений (рисунок 6), следовательно, нулевую гипотезу нельзя отклонить.
Рисунок 6
Ответ. На уровне значимости = 0,01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.
Заключение
статистическая гипотеза проверка
Проверка статистических гипотез - необходимая методика, используемая для получения данных в статистике.
Проведенная работа позволила сделать следующие выводы:
- Под статистической гипотезой понимаются различного рода предположения относительно характера или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты наблюдений в случайной выборке.
- Смысл проверки статистической гипотезы состоит в том, чтобы по имеющимся статистическим данным принять или отклонить статистическую гипотезу с минимальным рисков ошибки. Эта проверка осуществляется по определенным правилам.
- Гипотезы классифицируются на: простые и сложные; параметрические и непараметрические; основные (высказанные) и альтернативные (конкурирующие).
- Проверка гипотезы осуществляется на основе выявления согласованности эмпирических данных с гипотетическими (теоретическими).
- Особенно часто процедура проверки статистических гипотез проводится для оценки существенности расхождений сводных характеристик отдельных совокупностей (групп): средних, относительных величин. Такого рода задачи, как правило, возникают в социальной статистике.
- Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К ), являющегося функцией от результатов наблюдения.
- В статистике в настоящее время имеется большое число критериев для проверки практически любых гипотез.
- Выбор критерия для проверки статистических гипотез может осуществляться на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощный среди всех возможных критериев.
- Для каждой проверки статистических гипотез существует определенный алгоритм.