Материал: Статистическая обработка данных

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

По результатам вычислений функции плотности, представленной в таблице 4.2., можно сделать вывод, что мода имеет один локальный максимум в окрестности точки х = 11,4275 и с частотой по n = 17.

Оценку медианы находим, используя вариационный ряд:

Так как N = 2k, k = N / 2 = 60 / 2 = 30

Сравнение оценок медианы и оценки математического ожидания показывает, что они отличаются на 1,34 %.

. Параметрическая оценка функции плотности распределения

Исходя из гипотезы, что заданная выборка имеет нормальный закон распределения, найдем параметрическую оценку функции плотности, используя формулу для плотности распределения вероятности нормального закона:

Где и известны - они вычисляются по выборке.

= 2,1976676 = 11,4634

Значения этой функции вычисляются для середины частичных интервалов вариационного ряда, т.е. при х = . На практике для упрощения вычислений функции , где i = 1,2,…, k, пользуются таблицами значений функции плотности стандартной нормальной величины.

Для этого вычисляем значения для i = 1,2,…, k, затем по таблице значений функций плотности стандартной нормальной величины находим значение .

=0,0478

=0,1539

=0,3123

=0,3989

=0,3187

=0,1604

=0,0508

=0,0101

Переходим к вычислению функции:

0,022

Функция , вычисленная при заданных параметрах и в середине частичного интервала, фактически является теоретической относительной частотой, отнесенной к середине частичного интервала.

Поэтому для определения теоретической частоты , распределенной по всей ширине интервала, эту функцию необходимо умножить на .

где h = 1,5

где N = 60

Результаты вычислений вероятностей и соответствующих частот приведены в таблице 5.2.

Из полученных результатов проведенных вычислений следует, что сумма вероятностей в интервале [6,1775; 18,1775) почти равна единице, а сумма всех частот равна 59,61. Данные результаты объясняются тем, что мы вычисляем вероятности в интервале, где заданы экспериментальные данные.

Сравнение экспериментальных и теоретических частот по критерию Пирсона с целью проверки гипотезы о нормальном распределении возможно только в том случае, если для каждого частичного интервала выполняется условие . Представленные в таблице 5.2 результаты вычислений показывают, что это условие выполняется не всегда. Поэтому все те частичные интервалы, для которых частоты , объединяем с соседними. Соответственно объединяем и экспериментальные частоты .

Таблица 5.1

0,0330,0670,1330,1890,1560,0440,0330,011
0,0220,070,1420,1820,1450,0730,0230,005

Рис. 1. График. Теоретическая и экспериментальная плотности вероятности.

Таблица 5.2

Результаты вычисления экспериментальных и теоретических вероятностей и частот

[xi-1; xi)
[6,1775; 7,6775)	3	6,9275	0,05	0,033	-2,064	0,022	0,033	1,98	2
[7,6775; 9,1775)	6	8,4275	0,1	0,067	-1,38	0,07	0,105	6,3	6
[9,1775; 10,6775)	12	9,9275	0,2	-0,7	0,142	0,213	12,78	13
[10,6775; 12,1775)	17	11,4275	0,283	0,189	-0,016	0,182	0,273	16,38	16
[12,1775; 13,6775)	14	12,9275	0,233	0,156	0,67	0,145	0,2175	13,05	13
[13,6775; 15,1775)	4	14,4275	0,067	0,044	1,35	0,073	0,1095	6,57	7
[15,1775; 16,6775)	3	15,9275	0,05	0,033	2,03	0,023	0,035	2,1	2
[16,6775; 18,1775)	1	17,4275	0,016	0,011	2,71	0,005	0,0075	0,45	1
Σ			0,999				0,9935	59,61

. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона

Для проверки гипотезы о нормальном распределении случайной величины Х сравнивают между собой экспериментальные и теоретические частоты по критерию Пирсона:

Статистика имеет распределение с V = k - r - 1 степенями свободы, где k - число интервалов эмпирического распределения, r - число параметров теоретического распределения, вычисленных по экспериментальным данным. Для нормального распределения число степеней свободы равно:

V=k -3

В теории математической статистики доказывается, что проверку гипотезы о модели закона распределения по критерию Пирсона можно делать только в том случае, если выполняются следующие неравенства:

N ≥ 50 ≥ 5 где i = 1,2,3…

Из результатов вычислений, приведенных в таблице 1.5.1, следует, что необходимое условие для применения критерия согласия Пирсона не выполнены, т.к. в некоторых группах < 5. Поэтому те группы вариационного ряда, для которых необходимое условие не выполняется, объединяют с соседними и, соответственно, уменьшают число групп, при этом частоты объединенных групп суммируются. Так объединяют все группы с частотами < 5 до тех пор, пока для каждой новой группы будет выполняться условие ≥ 5.

При уменьшении числа групп для теоретических частот соответственно уменьшают и число групп для эмпирических частот. После объединения групп в формуле для числа степеней свободы V=k-3 в качестве k принимают новое число групп, полученное после объединения частот.

Результаты объединения интервалов и теоретических частот для таблицы 5.2 приведены соответственно в таблице 6.1.

Результаты вычислений из таблицы 6.1 можно использовать для проверки гипотезы о нормальном распределении с помощью критерия Пирсона.

Задаются уровнем значимости а =0,05 или одним из следующих значений: а1 = 0,01; а2 = 0,1; а3 = 0,005.

Вычисляют наблюдаемые значения критерия, используя экспериментальные и теоретические частоты из таблицы 6.1.

Для выборочного уровня значимости а = 0,05 по таблице распределения находят критические значения при числе степеней свободы V= k-3, где k - число групп эмпирического распределения.

Сравниваем фактически наблюдаемое с критическим , найденным по таблице, и принимаем решение:

если > , то выдвинутая гипотезы о теоретическом законе распределения отвергается при заданном уровне значимости.

Если < , то выдвинутая гипотеза о теоретическом законе распределения не противоречит выборке наблюдений при заданном уровне значимости, т.е. нет оснований отвергать гипотезу о нормальном распределении, т.к. эмпирические и теоретические частоты различаются незначительно (случайно).

Таблица 6.1

Результаты объединения интервалов и теоретических частот


[6,1775; 9,1775)	0,138	8,28	9	0,5184	0,0626
[9,1775; 10,6775)	0,213	12,78	12	0,6084	0,0476
[10,6775; 12,1775)	0,273	16,38	17	0,3844	0,0235
[12,1775; 13,6775)	0,2175	13,05	14	0,9025	0,0692
[13,6775; 18,1775)	0,152	9,12	8	1,2544	0,1375
Σ	0,9935	59,61	600,3404

При выбранном уровне значимости а = 0,05 и числе групп k = 5, число степеней свободы V = 2.

По таблице для а = 0,05 и V = 2 находим = 5,99147.

В результате получаем:

Для = 0,3404, найденного по результатам вычислений приведенных в таблице 6.1, имеем:

= 0,3404< = 5,99147

Из этого следует, что нет оснований отвергать гипотезу о нормальном распределении случайной величины Х.

Заключение

Статистические методы (методы, основанные на использовании математической статистики), являются эффективным инструментом сбора и анализа информации о качестве. Применение этих методов, не требует больших затрат и позволяет с заданной степенью точности и достоверностью судить о состоянии исследуемых явлений (объектов, процессов) в системе качества, прогнозировать и регулировать проблемы на всех этапах жизненного цикла продукции и на основе этого вырабатывать оптимальные управленческие решения.

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_10_Эмиль Золя для эл версии
_11_А. Франс для эл версии
_3 тема - Диффузия