Курсовой проект
по дисциплине «Статистика»
на
тему: Статистическая обработка данных
Содержание
Введение
1. Постановка задачи. Цель работы. Исходные данные
. Вычисление основных выборочных характеристик по заданной выборке
. Результаты вычисления интервальных оценок для математического ожидания и дисперсии
. Результаты ранжирования выборочных данных и вычисление моды и медианы
. Параметрическая оценка функции плотности распределения
. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона
Заключение
Список использованной литературы
интервальный дисперсия
выборочный данные
Введение
Целью данной курсовой работы является изучение
и, как в следствии, расширение знаний о математической статистике, ознакомление
с методами обработки экспериментального материала, с целью получения надежных
выводов, ознакомление с методикой применения статистических критериев для
проверки гипотез.
. Постановка задачи. Цель работы. Исходные
данные
1) Задача:
По выборке объёма N провести статистическую обработку результатов эксперимента.
) Цель работы:
Изучить и усвоить основные понятия математической статистики. Овладеть методикой статистического оценивания числовых характеристик случайной величины и нормального закона распределения. Ознакомиться с методикой применения статистических критериев для проверки гипотез.
) Исходные данные.
Проведен эксперимент, в результате которого была
получена выборка N = 60,
которая соответствует случайной величине, распределённой по нормальному закону.
Данная выборка представлена в таблице 1.1
Таблица 1.1
|
10.2836 |
10.7148 |
9.4963 |
12.8971 |
10.9190 |
12.8067 |
|
14.0510 |
7.3201 |
7.9052 |
15.2359 |
10.6512 |
9.6341 |
|
11.0156 |
12.4240 |
8.9727 |
12.1429 |
13.1025 |
11.9252 |
|
11.8667 |
8.3636 |
10.2223 |
9.1232 |
12.2658 |
11.1741 |
|
10.8028 |
10.4434 |
11.2314 |
9.6948 |
11.0725 |
8.3374 |
|
12.4564 |
9.5759 |
8.7116 |
14.2939 |
9.5319 |
13.1150 |
|
11.8891 |
17.3345 |
6.9275 |
13.3734 |
13.4795 |
13.8429 |
|
12.1071 |
11.7579 |
14.8285 |
9.5450 |
12.1039 |
|
|
12.9304 |
7.3669 |
12.4592 |
12.3466 |
11.8461 |
11.5607 |
|
10.7288 |
15.9654 |
16.1488 |
9.8759 |
12.9522 |
12.5015 |
2. Вычисление основных выборочных характеристик
по заданной выборке среднее арифметическое случайной величины Х (N
= 60)
) среднее
линейное отклонение
) дисперсия
случайной величины Х
)
несмещенная оценка дисперсии
5) среднеквадратическое отклонение
=
6) несмещенная выборочная оценка для среднеквадратического отклонения
7)
коэффициент вариации
)
коэффициент асимметрии случайной величины Х
9) коэффициент эксцесса случайной
величины Х
10) вариационный размах
= Xmax - Xmin = 17,3345-
6,9275= 10,407
На основании полученных вычислений можно сделать следующие выводы:
Выполняется необходимое условие для
того, чтобы выборка имела нормальный закон распределения, т.к. для коэффициента
вариации V выполняется
неравенство:
V =
< 33%
Отсюда следует, что не все выборочные значения случайной величины Х положительны, что мы и видим в исходных данных.
Для нормального распределения коэффициенты асимметрии и эксцесса должны быть равны нулю, т.е. As = E = 0.
По результатам вычисления асимметрия близка к нулю и составляет As = 0,22481644
В нашем случае асимметрия положительна, это значит, что «длинная часть» кривой расположена справа от математического ожидания.
Коэффициент эксцесса так же как и
коэффициент асимметрии близок к нулю, так как Е =
. Он
отрицательный, значит, кривая имеет более низкую и «плоскую» вершину, чем
нормальная кривая.
В связи с этим необходимы
дополнительные исследования для выяснения степени близости распределения
выборки к нормальному распределению.
3.Результаты вычисления интервальных
оценок для математического ожидания и дисперсии
Для вычисления интервальной оценки
математического ожидания воспользуемся формулой:
Где а = М[X] - математическое ожидание
N - 1 = V = 59 - число степеней свободы
tv;p - величина,
численно равная половине интервала, в который может попасть случайная величина
, имеющая
определенный закон распределения при заданной доверительной вероятности Р и
заданном числе степеней свободы V.
Подставляем в формулу вычисленные
ранее значения
,
и N.
Задаемся доверительной вероятностью:
Р1 = 0,95 Р2 = 0,99
Для каждого значения Рi (i=1,2)
находим по таблице значения t59;p и вычисляем
два варианта интервальных оценок для математического ожидания.
При Р1 = 0,95 t59;0,95 = 2
При Р2 = 0,99 t59;0,95 = 2,66
Для интервальной оценки дисперсии
существуют неравенства:
Поставляем в неравенство известные
значения
и N, получим
неравенство, в котором неизвестны
и
.
Задаваясь доверительной вероятностью
Рi (или
уровнем значимости а) вычисляем значения
и
. Используем эти два значения и
степень свободы V = N - 1 = 59,
по таблице находим
и
.
=
=
=
=
и
- это границы интервала, в который
попадает случайная величина Х, имеющая
(хи-квадрат) распределение
вероятности Рi и заданной
степени свободы V (V=59).
Для Р1 = 0,95
и
находим по таблице:
=
= 40,4817
=
= 83,2976
Подставляя в неравенства
и
и,
вычисляя, получим интервальную оценку.
При Р2 = 0,99
и ![]()
=
= 91,9517
Поставляя в неравенства
и
, и
вычисляя, получим интервальную оценку.
Для интервальной оценки среднеквадратического
отклонения имеем:
При Р1 = 0,95
При Р2 = 0,99
4. Результаты ранжирования
выборочных данных и вычисление моды и медианы
Используя исходные данные,
записываем все заданные значения выборки в виде неубывающей последовательности
значений случайной величины Х, которые представлены в таблице 4.1.
Таблица 4.1
Ранжированный ряд
|
6,9275 |
9,5319 |
10,6512 |
11,7579 |
12,4240 |
13,3734 |
|
7,3201 |
9,5450 |
10,7148 |
11,8461 |
12,4564 |
13,4795 |
|
7,3669 |
9,5759 |
10,7288 |
11,8667 |
12,4592 |
13,8429 |
|
7,9052 |
9,6341 |
10,8028 |
11,8891 |
12,5015 |
14,0510 |
|
8,3374 |
9,6948 |
10,9190 |
11,9252 |
12,8067 |
14,2939 |
|
8,3636 |
9,8759 |
11,0156 |
12,1039 |
12,8971 |
14,8285 |
|
8,7116 |
10,1539 |
11,0725 |
12,1071 |
12,9304 |
15,2359 |
|
8,9727 |
10,2223 |
11,1741 |
12,1429 |
12,9522 |
15,9654 |
|
9,1232 |
10,2836 |
11,2314 |
12,2658 |
13,1025 |
16,1488 |
|
9,4963 |
10,4434 |
11,5607 |
13,1150 |
17,3345 |
Интервал [6,9275; 17,3345], содержащий все элементы выборки, разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.
По формуле Стерджеса длина частичного интервала
равна:
Для удобства и простоты расчетов выбираем h = 1,5 и вычисляем последовательно границы интервалов.
За начало первого интервала
принимаем значение:
Далее вычисляем границы интервалов.
= 6,1775 + 1,5 = 7,6775
= 7,6775 + 1,5 = 9,1775
= 9,1775+ 1,5 = 10,6775
= 10,1775+ 1,5 = 12,1775
= 12,1775+ 1,5 = 13,6775
= 13,6775+ 1,5 = 15,1775
= 15,1775+ 1,5 = 16,6775
= 16,6775+ 1,5 = 18,1775
Вычисление границ заканчивается, как только выполняется неравенство Xn > Xmax, то есть X8 = 18,1775> Xmax = 17,3345.
По результатам вычислений составляем
таблицу. В первой графе таблицы помещаем частичные интервалы, во второй графе -
середины интервалов, в третьей графе записано количество элементов выборки,
попавших в каждый интервал - частоты, в четвертой графе записаны относительные частоты
и в пятой графе записаны значения плотности относительных частот или значения
выборочной, экспериментальной функции плотности. Данная информация представлена
в таблице 4.2.
Таблица 4.2
Значение выборочной функции и плотности
|
h |
|
|
|
|
|
|
[6,1775; 7,6775) |
6,9275 |
3 |
0,05 |
0,033 |
33 |
|
[7,6775; 9,1775) |
8,4275 |
6 |
0,1 |
0,067 |
67 |
|
[9,1775; 10,6775) |
9,9275 |
12 |
0,2 |
0,133 |
133 |
|
[10,6775; 12,1775) |
11,4275 |
17 |
0,283 |
0,189 |
189 |
|
[12,1775; 13,6775) |
12,9275 |
14 |
0,233 |
0,156 |
156 |
|
[13,6775; 15,1775) |
14,4275 |
4 |
0,067 |
0,044 |
44 |
|
[15,1775; 16,6775) |
15,9275 |
3 |
0,05 |
0,033 |
33 |
|
[16,6775; 18,1775) |
17,4275 |
1 |
0,016 |
0,011 |