Материал: 1749

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

20

8. В графу №8 записываем промежуточные значения

k ~ 2

сумму i Pi *.

~ 2 и их

i Pi *

i1

9.Вычисляем статистическую дисперсию, среднее квадратическое

отклонение, асимметрию и эксцесс:

 

 

k

~

2

Pi * mx *

2

0,173856;

 

Dx* i

 

 

 

 

i 1

 

 

 

 

 

 

*

 

0,416960;

А* 0,725384;

Е* 2,930372.

Dx *

По данным наблюдений статистическое среднее mx * и среднее квадратическое отклонение * по значению почти совпадают, а также вид гистограммы позволяют предположить, что случайная величина имеет показательное распределение.

Выдвинута гипотеза о распределении генеральной совокупности по показательному закону с плотностью

0,

x 0;

f x

e x , x 0.

 

Этот закон распределения называется теоретическим, тогда теоретические вероятности Pi находим по формуле

xi

xi

Pi f x dx *e *xdx e *xi 1 e *xi ,

xi 1

xi 1

где *– оценка параметра показательного закона распределения по выборке.

Для нашего примера *

1

 

2,42.

 

 

 

 

 

mx

 

 

 

 

 

 

 

 

 

*

 

 

 

 

0,1

 

0,1

 

 

 

 

 

 

0,2

 

Тогда P1 *e *x e *x

 

0,2134; P2

e *x

 

0,1688 и т.д.

 

 

 

0

 

0,1

0

 

 

 

 

 

 

 

 

 

 

Занесём их в таблицу в графу №10. В качестве меры расхождения между статистическим и гипотетическим (теоретическим) распределениями возьмём критерий согласия Пирсона K χ2.

Мера расхождения в этом критерии определяется равенством

k

n

i

nP

χ2

 

 

i

,

 

 

nP

 

i 1

 

 

i

 

 

где n объём выборки (у нас n 200);

ni

число элементов в i-ом интер-

вале; K число интервалов (у нас K 11); Pi теоретические вероятности попадания значений случайной величины в i-й интервал.

21

Промежуточные значения ni nPi 2 запишем в графу №11 таблицы nPi

значений.

Случайная величина χ2 (мера расхождения) независимо от вида закона распределения генеральной совокупности при n 50 имеет распределение χ2 с числом степеней свободы r K 1, где K число интервалов; число параметров распределения, определенных по выборке. В нашем примере K 11, 1, r 9.

Для распределения χ2 составлены таблицы (прил. 2), пользуясь ими, можно для каждого значения χ2 и числа степеней свободы r найти вероятность P того, что величина, распределённая по закону χ2 , превзойдёт это значение. Если вероятность P очень мала (не превосходит выбранного нами уровня значимости , такого, что событие с вероятностью считается практически невозможным), это значит, что опытные данные противоречат выдвинутой гипотезе, а случайная величина имеет названное нами распределение. Эту гипотезу отбрасывают.

Если же вероятность P не мала, можно признать, что расхождение между теоретическим и статистическим распределениями несущественно и объясняется случайными причинами. Выдвинутую гипотезу о законе распределения можно считать правдоподобной.

Зададим уровень значимости 0,1 и найдём χ2 по таблице значе-

ний χ2 (см. прил. 2), χ2 14,68. Сравним вычисленное χ2 с χ2 ; χ2 χвыч2 , следовательно, предполагаемая гипотеза может быть принята на уровне значимости .

В результате заключаем, что данные наблюдений согласуются с гипотезой о показательном распределении генеральной совокупности.

9. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ

По данным выборки находим оценки математического ожидания и дисперсии генеральной совокупности:

 

 

1

m

 

1

m

 

 

 

 

 

 

 

 

X

 

xi ;

S2

 

(xi

X)2 .

 

 

 

 

 

n i 1

 

n i 1

 

 

 

Оценки математического ожидания и дисперсии, полученные в результате обработки выборки, называются точечными и могут меняться от выборки к выборке, т.е. являются случайными величинами.

В случае точечных оценок мы должны указать, с какой степенью точности можно говорить о том, что отклонение оценки X от оцениваемо-

 

 

22

 

 

 

 

го параметра mx

a не превзойдет определенную величину.

По заданной вероятности (иначе надежности) определяем число

такое, что P[(m*x

mx ) ] или

P

 

mx

 

.

X

X

Интервал X mx X с вероятностью , содержащий истинное значение параметра mx a, называется доверительным интервалом, а вероятность – доверительной вероятностью.

Интервальной оценкой с надежностью математического ожидания

a нормально распределенной совокупности по выборочной средней X при известном среднем квадратическом отклонении генеральной совокупности служит

P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

z

x2

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

X a

 

 

 

 

 

 

 

 

x

 

 

e

 

dx функция Лапла-

2

 

 

 

 

 

 

 

, где

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

са.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Из равенства 2

 

 

 

 

 

 

,

пользуясь таблицей значений функции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

является

Лапласа (прил. 1), можно определить . Интервал

 

;

 

X

X

доверительным интервалом для математического ожидания, соответствующим доверительной вероятности (как правило, 0,9; 0,95; 0,99).

Если параметр неизвестен, то простая замена его оценкой * может привести к заметным ошибкам.

В курсе математической статистики доказывается, что случайная величина t, в случае выборки из нормальной совокупности, имеет распреде-

 

 

 

 

X a

с n 1 -й степенью свободы, не зави-

 

 

 

ление Стьюдента

t

n 1

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

сящее от параметров генеральной совокупности. В этом случае интервал

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

tj

 

 

 

 

; X tj

 

 

 

 

 

 

является доверительным интервалом для ма-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

n 1

тематического ожидания.

 

 

 

 

 

 

 

 

 

В случае выборки из нормальной совокупности с параметрами a,

 

 

 

 

 

 

 

 

 

 

 

 

nS2

где S2 оценка неизвестной дисперсии, равная

случайная величина

 

 

,

 

2

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

xi

a 2 , имеет распределение 2 с n степенями свободы. Если

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

параметр a неизвестен,

 

то его заменяют оценкой

 

. В этом случае слу-

 

X

23

чайная величина

nS2

 

также имеет распределение 2, но уже с n 1 сте-

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пенью свободы.

выбраны так, что P 12

2 22 , то это равенст-

Если 12 и 22

 

 

2

 

nS2

 

 

2

 

 

 

 

 

во означает, что

1

 

 

 

 

 

 

 

2

с вероятностью . Из этого равенства

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nS2

 

 

2

 

nS2

 

следует, что интервал

 

 

 

 

 

 

 

 

 

 

 

является доверительным интер-

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

 

 

 

1

 

 

 

валом для дисперсии, соответствующей доверительной вероятности .

Поскольку по заданной вероятности можно построить множество

доверительных интервалов для дисперсии,

то принято 12 и 22 выбирать

так, чтобы P 2 12 P 2 22

1

,

где 12 и 22 определяются по

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

таблице значений 2 (см. прил. 2).

10. ДВУМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

Во многих задачах практики приходится рассматривать совместно несколько случайных величин X1, X2 , Xn . Совокупность таких величин называют векторной или многомерной случайной величиной.

Рассмотрим двумерную случайную величину. Двумерную случайную величину X,Y можно рассматривать как случайную точку или как случайный вектор на координатной плоскости. Если множество возможных значений двумерной случайной величины X,Y – счётное (или конечное), то в этом случае двумерная случайная величина X,Y называется дискретной.

Для задания двумерной случайной величины дискретного типа достаточно указать её возможные значения Xi ,Yk и соответствующие вероятности Pik : Pik P X Xi ,Y Yk . Здесь Pik есть вероятность того, что случайная величина X примет значение Xi и одновременно случайная ве-

личина Y примет значение Yk , то есть Pik вероятность произведения двух событий X Xi и Y Yk , при этом, должно выполняется условие

Pik 1.

i 1 k 1

Двумерная случайная величина X,Y называется непрерывно распределённой, если:

24

1)значения X,Y заполняют область (или несколько областей) на плоскости XOY ;

2)существует неотрицательная функция f x, y , называемая дву-

мерной плотностью распределения вероятностей, что вероятность принадлежности случайной величины X,Y любой области D равна двойному

интегралу по этой области от f x, y :

P X,Y D f x, y dxdy.

 

D

 

 

Очевидно, что f x, y dxdy 1.

 

 

 

Элементы теории корреляции

Функциональная зависимость между двумя переменными величинами X и Y характеризуется тем, что каждому значению одной из них соответствует вполне определённое значение другой. Эти связи изучаются в математическом анализе.

На практике часто встречаются такие зависимости, когда численному значению одной из величин не соответствует определённое значение другой. Может оказаться, что каждому значению переменной величины X соответствует статистическое распределение переменной величины Y , изменяющееся вместе с изменением X . Такие зависимости между двумя переменными называются статистическими и задаются в виде таблицы, которая называется корреляционной.

Пример 1

Y

13-17

17-23

23-27

27-33

33-37

37-43

ny

X

 

 

 

 

 

 

 

10-20

4

1

 

 

 

 

5

20-30

 

6

4

 

 

 

10

30-40

 

 

2

50

2

 

54

40-50

 

 

1

9

7

 

17

50-60

 

 

 

4

3

7

14

nx

4

7

7

63

12

7

100

Таблица показывает произведение 100 наблюдений для соответствующих переменных величин X и Y . Пусть Y прибыль в тыс. руб. и X издержки в процентах для 100 предприятий.

По этой таблице получаем, что на 4-х предприятиях прибыль составила 10-20 тыс. руб., а издержки 13-17 % (пересечение первой строки и первого столбца). Другие данные таблицы читаются аналогично.

От интервальных переходят к дискретным распределениями. Для этого за значения величин x и y принимаем середины соответствующих