Курсовая работа: Принципы статистической проверки гипотез

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н 0 : X = Y - генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями равны (применительно к условию данной задачи - предприятия 2 групп относятся к одному типу предприятий: средняя производительность труда в 2 группах - одинакова).

Н 1 : X? Y- генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями неравны (применительно к условию данной задачи - предприятия 2 групп относятся к разному типу предприятий: средняя производительность труда в 2 группах - неодинакова).

Выдвигаем двустороннюю конкурирующую гипотезу, так как из условия задачи не следует, что необходимо выяснить больше или меньше производительность труда в одной из групп предприятий по сравнению с другой.

Поскольку конкурирующая гипотеза - двусторонняя, то и критическая область - двусторонняя.

В качестве критерия для сравнения 2 средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), используется случайная величина Z .

Его наблюдаемое значение (Z набл ) рассчитывается по формуле

где X - выборочная средняя для X ; Y- выборочная средняя для Y; 1>(Х ) - генеральная дисперсия для X; D ( Y ) - генеральная дисперсия для Y; пх - объем выборки для X ; пу - объем выборки для Y .

Найдем наблюдаемое значение (z набл ):

Так как конкурирующая гипотеза - двусторонняя, критическое значение (z кр ) следует находить по таблице функции Лапласа (приложение 3) из равенства

Ф(z кр )= (1)

По условию = 0,05.

Отсюда

Ф0 (z кр )=(1-0,05) /2 = 0,475.

По таблице функции Лапласа (приложение 3) найдем, при каком (z кр ) Ф0 (z кр )=0,475.

Ф0 (1,96) = 0,475.

Учитывая, что конкурирующая гипотеза - двусторонняя, находим две критические точки:

z кр( n ) = 1,96; z кр(л) = -1,96

Заметим, что при левосторонней конкурирующей гипотезе Н 1 : X < Yz кр следует находить по таблице функции Лапласа (приложение 3) из равенства Ф0 (z кр ) = (1 - 2)/2 и присваивать ему знак «минус».

При правосторонней конкурирующей гипотезе Н1 : X > Yz кр находим по таблице функции Лапласа (приложение 3) из равенства Ф0 (z кр ) = (1 - 2)/2.

Z набл > z кр , следовательно, на данном уровне значимости нулевая гипотеза отвергается в пользу конкурирующей. На уровне значимости = 0,05 можно утверждать, что полученное различие средних показателей производительности труда в группах неслучайно, имеются 2 типа предприятий с различной средней величиной производительности труда.

Наблюдаемое значение критерия попадает в критическую область (рисунок 5), следовательно, нулевая гипотеза отклоняется в пользу конкурирующей.

Рисунок 5

Ответ. На уровне значимости = 0,05 можно утверждать, что полученное различие средних показателей производительности труда в группах неслучайно, имеются 2 типа предприятий с различной средней величиной производительности труда.

2.4 Проверка гипотезы о законе распределения генеральной совокупности с использованием критерия Фишера-Снедекора

Пример. Предполагается, что применение нового типа резца сократит время обработки некоторой детали. Хронометраж времени обработки 9 деталей, обработанных старым типом резцов, дал следующие результаты: среднее время обработки детали X - 57 мин, исправленная выборочная дисперсия s2 х = 186,2 (мин2 ). Среднее время обработки 15 деталей, обработанных новым типом резцов, - Y по данным хронометражных измерений - 52 мин, а исправленная выборочная дисперсия s2 х = 166,4 (мин2 ). На уровне значимости = 0,01 ответьте на вопрос, позволило ли использование нового типа резцов сократить время обработки детали?

Решение. Для решения данной задачи необходимо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых неизвестны, но предполагаются одинаковыми (малые независимые выборки). В этой задаче речь идет о малых выборках, так как nх = 9 и nу = 15 меньше 30. Выборки - независимые, поскольку из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0 :X = Y- генеральные средние 2 нормально распределенных совокупностей с неизвестными дисперсиями (но предполагаемыми одинаковыми) равны (применительно к условию данной задачи -среднее время, затрачиваемое на обработку детали резцами нового и старого типа, - одинаково, т. е. использование нового типа резца не позволяет снизить время на обработку детали).

Н1 : X > Y- генеральная средняя для X больше, чем генеральная средняя для Y (применительно к условию данной задачи - среднее время, затрачиваемое на обработку детали резцами старого типа, больше, чем - нового, т. е. использование нового типа резца позволяет снизить время на обработку детали).

Так как конкурирующая гипотеза - правосторонняя, то и критическая область - правосторонняя.

Приступать к проверке гипотезы о равенстве генеральных средних 2 нормально - распределенных совокупностей с неизвестными дисперсиями можно лишь в том случае, если генеральные дисперсии равны. В противном случае, данная задача в теории неразрешима.

Поэтому, прежде чем проверять эту гипотезу, проверим гипотезу о равенстве генеральных дисперсий нормальных совокупностей.

Сформулируем нулевую и конкурирующую гипотезы, согласно условию задачи.

Н0 : D(Х)=D(Y) - генеральные дисперсии 2 нормально распределенных совокупностей равны.

Н0 : D(Х) >D(Y) - генеральная дисперсия для X больше генеральной дисперсии для У. Выдвигаем правостороннюю конкурирующую гипотезу, так как исправленная выборочная дисперсия для X значительно больше, чем исправленная выборочная дисперсия для Y.

Так как конкурирующая гипотеза - правосторонняя, то и критическая область - правосторонняя.

В качестве критерия для сравнения 2 дисперсий нормальных генеральных совокупностей используется случайная величина Р - критерий Фишера-Снедекора (приложение 4).

Его наблюдаемое значение (f набл ) рассчитывается по формуле

где s- большая (по величине) исправленная выборочная дисперсия; s2 - меньшая (по величине) исправленная выборочная дисперсия.

Найдем f набл

Критическое значение (f кр ) следует находить с помощью таблицы распределения Фишера-Снедекора (приложение 4) по уровню значимости и числу степеней свободы k и k 2 .

По условию а = 0,01; число степеней свободы найдем по формуле

k 1 = n1 - 1; k 2 = n2 - 1,

где k 1 - число степеней свободы большей (по величине) исправленной дисперсии; k 2 - число степеней свободы меньшей (по величине) исправленной дисперсии; n1 - объем выборки большей (по величине) исправленной дисперсии; n2 - объем выборки меньшей (по величине) исправленной дисперсии.

Найдем k 1 и k 2

k 1 = 10 - 1 = 9;

k 2 = 15 - 1 = 14.

Определяем f кр по уровню значимости = 0,01 и числу степеней свободы k 1 =9 и k 2 =14:

f кр( = 0,01; k 1 =9; k 2 =14)

f набл < f кр следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей.

Следовательно, Можно приступить к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей.

Найдемt набл

Критическое значение (t кр ) следует находить по таблице распределения Стьюдента (приложение 2) по уровню значимости и числу степеней свободы k .

По условию = 0,01; число степеней свободы найдем по формуле

k = nх + ny - 2,

де k - число степеней свободы; nх - объем выборки для X; ny - объем выборки для Y.

k = 9 + 15 - 2 = 22.

Найдем t кр по уровню значимости = 0,01 (для односторонней критической области) и числу степеней свободы k = 22

Заметим, что при левосторонней конкурирующей гипотезе X < Yt кр следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости (для односторонней критической области) и числу степеней свободы k = nх + ny - 2 и присваивать ему знак «минус».

При двусторонней конкурирующей гипотезе Х?Yt кр находим по таблицам распределения Стьюдента (приложение 3) по уровню значимости (для двусторонней критической области) и числу степеней свободы k = nх + ny - 2.

t набл < t кр следовательно, на этом уровне значимости нет оснований отвергнуть нулевую гипотезу.

По имеющимся хронометрическим данным на уровне значимости а = 0,01 нельзя отклонить гипотезу о том, что генеральные средние равны, т. е. среднее время, затрачиваемое на обработку детали старым и новым типом резцов, отличается незначимо, расхождения между средними - случайны, использование нового типа резцов не позволяет снизить время обработки детали.

Наблюдаемое значение критерия попадает в область допустимых значений (рисунок 6), следовательно, нулевую гипотезу нельзя отклонить.

Рисунок 6

Ответ. На уровне значимости = 0,01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.

Заключение

статистическая гипотеза проверка

Проверка статистических гипотез - необходимая методика, используемая для получения данных в статистике.

Проведенная работа позволила сделать следующие выводы:

- Под статистической гипотезой понимаются различного рода предположения относительно характера или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты наблюдений в случайной выборке.

- Смысл проверки статистической гипотезы состоит в том, чтобы по имеющимся статистическим данным принять или отклонить статистическую гипотезу с минимальным рисков ошибки. Эта проверка осуществляется по определенным правилам.

- Гипотезы классифицируются на: простые и сложные; параметрические и непараметрические; основные (высказанные) и альтернативные (конкурирующие).

- Проверка гипотезы осуществляется на основе выявления согласованности эмпирических данных с гипотетическими (теоретическими).

- Особенно часто процедура проверки статистических гипотез проводится для оценки существенности расхождений сводных характеристик отдельных совокупностей (групп): средних, относительных величин. Такого рода задачи, как правило, возникают в социальной статистике.

- Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К ), являющегося функцией от результатов наблюдения.

- В статистике в настоящее время имеется большое число критериев для проверки практически любых гипотез.

- Выбор критерия для проверки статистических гипотез может осуществляться на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощный среди всех возможных критериев.

- Для каждой проверки статистических гипотез существует определенный алгоритм.