Материал: Статистическая обработка данных

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

По результатам вычислений функции плотности, представленной в таблице 4.2., можно сделать вывод, что мода имеет один локальный максимум в окрестности точки х = 11,4275 и с частотой по n = 17.

Оценку медианы находим, используя вариационный ряд:


Так как N = 2k, k = N / 2 = 60 / 2 = 30

Сравнение оценок медианы  и оценки математического ожидания  показывает, что они отличаются на 1,34 %.

. Параметрическая оценка функции плотности распределения

Исходя из гипотезы, что заданная выборка имеет нормальный закон распределения, найдем параметрическую оценку функции плотности, используя формулу для плотности распределения вероятности нормального закона:


Где  и  известны - они вычисляются по выборке.

= 2,1976676 = 11,4634

Значения этой функции вычисляются для середины частичных интервалов вариационного ряда, т.е. при х = . На практике для упрощения вычислений функции , где i = 1,2,…, k, пользуются таблицами значений функции плотности стандартной нормальной величины.

Для этого вычисляем значения  для i = 1,2,…, k, затем по таблице значений функций плотности стандартной нормальной величины находим значение .

 =0,0478

 =0,1539

 =0,3123

 =0,3989

 =0,3187

 =0,1604

 =0,0508

 =0,0101

Переходим к вычислению функции:

 0,022  

  

  

  

Функция , вычисленная при заданных параметрах  и  в середине частичного интервала, фактически является теоретической относительной частотой, отнесенной к середине частичного интервала.


Поэтому для определения теоретической частоты , распределенной по всей ширине интервала, эту функцию необходимо умножить на .

 где h = 1,5

 

 где N = 60

 

Результаты вычислений вероятностей и соответствующих частот приведены в таблице 5.2.

  

Из полученных результатов проведенных вычислений следует, что сумма вероятностей в интервале [6,1775; 18,1775) почти равна единице, а сумма всех частот равна 59,61. Данные результаты объясняются тем, что мы вычисляем вероятности в интервале, где заданы экспериментальные данные.

Сравнение экспериментальных и теоретических частот по критерию Пирсона с целью проверки гипотезы о нормальном распределении возможно только в том случае, если для каждого частичного интервала выполняется условие . Представленные в таблице 5.2 результаты вычислений показывают, что это условие выполняется не всегда. Поэтому все те частичные интервалы, для которых частоты , объединяем с соседними. Соответственно объединяем и экспериментальные частоты .

Таблица 5.1

0,0330,0670,1330,1890,1560,0440,0330,011









0,0220,070,1420,1820,1450,0730,0230,005










Рис. 1. График. Теоретическая и экспериментальная плотности вероятности.

Таблица 5.2

Результаты вычисления экспериментальных и теоретических вероятностей и частот

[xi-1; xi)









[6,1775; 7,6775)

3

6,9275

0,05

0,033

-2,064

0,022

0,033

1,98

2

[7,6775; 9,1775)

6

8,4275

0,1

0,067

-1,38

0,07

0,105

6,3

6

[9,1775; 10,6775)

12

9,9275

0,2

-0,7

0,142

0,213

12,78

13

[10,6775; 12,1775)

17

11,4275

0,283

0,189

-0,016

0,182

0,273

16,38

16

[12,1775; 13,6775)

14

12,9275

0,233

0,156

0,67

0,145

0,2175

13,05

13

[13,6775; 15,1775)

4

14,4275

0,067

0,044

1,35

0,073

0,1095

6,57

7

[15,1775; 16,6775)

3

15,9275

0,05

0,033

2,03

0,023

0,035

2,1

2

[16,6775; 18,1775)

1

17,4275

0,016

0,011

2,71

0,005

0,0075

0,45

1

Σ



0,999




0,9935

59,61



. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона

Для проверки гипотезы о нормальном распределении случайной величины Х сравнивают между собой экспериментальные и теоретические частоты по критерию Пирсона:


Статистика  имеет распределение с V = k - r - 1 степенями свободы, где k - число интервалов эмпирического распределения, r - число параметров теоретического распределения, вычисленных по экспериментальным данным. Для нормального распределения число степеней свободы равно:

V=k -3

В теории математической статистики доказывается, что проверку гипотезы о модели закона распределения по критерию Пирсона можно делать только в том случае, если выполняются следующие неравенства:

N ≥ 50  ≥ 5 где i = 1,2,3…

Из результатов вычислений, приведенных в таблице 1.5.1, следует, что необходимое условие для применения критерия согласия Пирсона не выполнены, т.к. в некоторых группах < 5. Поэтому те группы вариационного ряда, для которых необходимое условие не выполняется, объединяют с соседними и, соответственно, уменьшают число групп, при этом частоты объединенных групп суммируются. Так объединяют все группы с частотами < 5 до тех пор, пока для каждой новой группы будет выполняться условие  ≥ 5.

При уменьшении числа групп для теоретических частот соответственно уменьшают и число групп для эмпирических частот. После объединения групп в формуле для числа степеней свободы V=k-3 в качестве k принимают новое число групп, полученное после объединения частот.

Результаты объединения интервалов и теоретических частот для таблицы 5.2 приведены соответственно в таблице 6.1.

Результаты вычислений из таблицы 6.1 можно использовать для проверки гипотезы о нормальном распределении с помощью критерия Пирсона.

Задаются уровнем значимости а =0,05 или одним из следующих значений: а1 = 0,01; а2 = 0,1; а3 = 0,005.

Вычисляют наблюдаемые значения критерия, используя экспериментальные и теоретические частоты из таблицы 6.1.


Для выборочного уровня значимости а = 0,05 по таблице распределения находят критические значения  при числе степеней свободы V= k-3, где k - число групп эмпирического распределения.

Сравниваем фактически наблюдаемое  с критическим , найденным по таблице, и принимаем решение:

если  > , то выдвинутая гипотезы о теоретическом законе распределения отвергается при заданном уровне значимости.

Если  < , то выдвинутая гипотеза о теоретическом законе распределения не противоречит выборке наблюдений при заданном уровне значимости, т.е. нет оснований отвергать гипотезу о нормальном распределении, т.к. эмпирические и теоретические частоты различаются незначительно (случайно).

Таблица 6.1

Результаты объединения интервалов и теоретических частот






[6,1775; 9,1775)

0,138

8,28

9

0,5184

0,0626

[9,1775; 10,6775)

0,213

12,78

12

0,6084

0,0476

[10,6775; 12,1775)

0,273

16,38

17

0,3844

0,0235

[12,1775; 13,6775)

0,2175

13,05

14

0,9025

0,0692

[13,6775; 18,1775)

0,152

9,12

8

1,2544

0,1375

Σ

0,9935

59,61

600,3404




При выбранном уровне значимости а = 0,05 и числе групп k = 5, число степеней свободы V = 2.

По таблице для а = 0,05 и V = 2 находим  = 5,99147.

В результате получаем:

Для = 0,3404, найденного по результатам вычислений приведенных в таблице 6.1, имеем:

= 0,3404<  = 5,99147

Из этого следует, что нет оснований отвергать гипотезу о нормальном распределении случайной величины Х.

Заключение

Статистические методы (методы, основанные на использовании математической статистики), являются эффективным инструментом сбора и анализа информации о качестве. Применение этих методов, не требует больших затрат и позволяет с заданной степенью точности и достоверностью судить о состоянии исследуемых явлений (объектов, процессов) в системе качества, прогнозировать и регулировать проблемы на всех этапах жизненного цикла продукции и на основе этого вырабатывать оптимальные управленческие решения.