Выборочные оценки являются приближёнными. Чтобы с помощью статистических данных можно было сделать правильные выводы, нужно
знать точность и надежность этих оценок. |
|
|
|
|
Пусть * |
— статистическая оценка неизвестного |
параметра |
. |
|
Надёжностью (доверительной вероятностью) оценки |
по |
* называют |
||
вероятность , |
с которой осуществляется неравенство | |
- *| < . |
|
|
Обычно надёжность оценки задается наперёд, причем в качестве
берут
число, близкое к единице. По надежности |
ищут такое число |
|
, чтобы |
|
||||||||||||||||||||||||||
|
|
|
Р(| - |
*|< |
|
)= . |
|
|
|
|
|
|
|
|
|
(5) |
|
|
|
|
|
|
||||||||
Число |
называют |
точностью |
оценки, |
или |
предельной |
ошибкой. |
Из |
|||||||||||||||||||||||
равенства (5) следует, что |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
Р( *- |
|
< Θ < |
* + |
|
) = . |
|
(6) |
|
|
|
|
|
|
|
|||||||||||||
Интервал |
( *- , *+ ) |
|
называется доверительным интервалом; |
он |
||||||||||||||||||||||||||
называется интервальной оценкой неизвестного параметра . |
|
|
|
|
|
|
||||||||||||||||||||||||
Интервальной оценкой с надежностью |
математического ожидания |
|||||||||||||||||||||||||||||
М(Х) = а нормально распределенного признака X генеральной |
||||||||||||||||||||||||||||||
совокупности при |
известном |
среднем |
квадратическом |
|
отклонении |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
D(X) этого признака служит доверительный интервал |
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
t |
, |
|
(7) |
|
|
|
|
|
|
|
||||
|
|
|
|
xв |
|
a |
xв |
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
n |
|
|
n |
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
где n — |
|
объём выборки, x в |
— выборочная средняя, t |
— значение |
||||||||||||||||||||||||||
аргумента |
|
функции |
Лапласа |
Ф(t), |
|
при |
котором Ф(t)= |
|
, |
|
|
t |
— |
|||||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
2 |
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
n |
||||||||||||||||||||||||||
точность оценки.
Пример 2. В ходе обследования банковских счетов была проведена случайная выборка записей по вкладам. Из выборки n = 100 оказалось, что средний размер вклада составляет 1 837 д.е.; среднее квадратическое отклонение размера вклада равно 280 д.е. Найти с надёжностью
= 0,95 доверительный интервал для среднего размера а вкладов по всем счетам, если известно, что размер вкладов распределён по нормальному закону.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Решение. По условию x в =1837; n = 100; |
= 280; = 0,95. По таблице |
||||||||||||||||||||||
|
|
|
|
|
|
|
1 |
|
t |
z2 |
|
|
|
|
|
|
|
|
|
||||||
значений функции |
|
|
2 |
|
находим |
|
t из условия |
Ф(t) = |
|||||||||||||||||
(t) |
|
0e |
dz |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
2n |
|
|
|
|
|
|
|
|
|
|
|
|||||
= |
|
0,95 |
0,475 , получаем |
t = |
1,96. По |
формуле (7) |
находим |
||||||||||||||||||
|
|
|
|
||||||||||||||||||||||
|
|
|
|
||||||||||||||||||||||
2 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
доверительный интервал: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
1837 |
1,96 |
280 |
|
a 1837 |
|
1,96 |
280 |
, |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
100 |
|
|
|
|||||||
1837 54,88 a 1837 54,88,
1782,12 a 1891,88.
Это означает, что с вероятностью, равной 0,95, можно утверждать, что средний размер вклада генеральной совокупности находится в пределах от 1 782,12 д.е. до 1 891,88 д.е. Интервал ±54,88 составляет примерно ±3% среднего размера вклада в выборке (1 837). Это не очень большое отклонение, поэтому среднее значение выборки можно считать надёжной оценкой среднего значения генеральной совокупности. Однако существует вероятность, равная 0,05 того, что можно получить значение вне доверительного интервала.
ТЕМА 8. ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИИ
Различные экономические показатели не являются независимыми, а связаны между собой; например, цена какого-либо товара и величина спроса на этот товар, объём производства и прибыль фирмы, располагаемый доход и объём личного потребления, инфляция и безработица. Взаимосвязи показателей в экономике редко имеют простой функциональный вид, поскольку на интересующий нас показатель, кроме явно учитываемых факторов, влияет еще множество других, которые являются случайными.
Поэтому одной из основных задач в экономических исследованиях является анализ зависимостей между переменными.
Пусть требуется оценить связь между переменными X и Y. Возникает два вопроса: 1) связаны ли между собой эти переменные; 2) какова теснота этой связи?
В качестве характеристики тесноты линейной связи между количественными признаками в выборке используется выборочный коэффициент корреляции (rВ).
Свойства выборочного коэффициента корреляции:
1)значения rВ заключены на отрезке от –1 до +1.
2)если rВ = 0, то между Х и У отсутствует линейная корреляционная связь, но возможно наличие между ними другого типа связи.
3)если rВ > 0, то увеличение признака Х в среднем приводит к увеличению признака У. Если rВ < 0, то с увеличением Х в среднем признак У уменьшается.
4)если rВ 1, то между Х и У существует линейная
функциональная зависимость, не искажаемая действием случайных факторов.
Для качественной оценки тесноты корреляционной связи между X и Y можно воспользоваться таблицей Чеддока (табл.1).
|
|
|
|
|
Таблица 1 |
Диапазон |
0,1–0,3 |
0,3–0,5 |
0,5–0,7 |
0,7–0,9 |
0,9–0,99 |
изменения | rB | |
|
|
|
|
|
Характер |
слабая |
умеренная |
заметная |
высокая |
весьма |
тесноты связи |
|
|
|
|
высокая |
Для проверки выборочного коэффициента корреляции на значимость выдвигаются две гипотезы:
основная гипотеза Но: rГ = 0, т.е. rB – незначим, а X и Y не связаны линейной корреляционной зависимостью.
конкурирующая гипотеза Н1: rГ ≠ 0, т.е. rB – значим, а между X и Y существует линейная корреляционная связь.
|
|
|
Алгоритм проверки основной гипотезы |
|
||||||
1. Рассчитать |
|
наблюдаемое |
значение |
критерия |
Стьюдента |
|||||
|
|
|
|
|
|
|
|
|
|
|
tнабл |
rB n |
2 |
|
. |
|
|
|
|||
|
|
|
|
|
|
|
|
|
||
1 |
|
r 2 |
|
|
|
|||||
|
|
|
|
B |
|
|
|
|
|
|
2.По таблице критических точек распределения Стьюдента
(приложение 4) найти критическую точку tкр(α, k) для двусторонней критической области при k=n−2.
3.Сравнить tнабл и tкр. Если |tнабл| < tкр – нет оснований отвергнуть Н0, т.е. выборочный коэффициент корреляции незначим. Если |tнабл| > tкр
– нулевая гипотеза отвергается, т.е. X и Y связаны линейной корреляционной зависимостью.
Пример. Выборочно обследовано 100 снабженческо-сбытовых предприятий некоторого региона по количеству работников X и объёмам складской реализации Y (д.е.). Результаты представлены в корреляционной таблице (табл.2).
Таблица 2
X |
5 |
15 |
25 |
35 |
45 |
ny |
У |
|
|
|
|
|
|
130 |
7 |
1 |
|
|
|
8 |
132 |
2 |
7 |
1 |
|
|
10 |
134 |
1 |
5 |
4 |
1 |
|
11 |
136 |
|
1 |
15 |
10 |
8 |
34 |
138 |
|
|
3 |
12 |
15 |
30 |
140 |
|
|
|
1 |
6 |
7 |
nх |
10 |
14 |
23 |
24 |
29 |
n=100 |
По данным исследования требуется:
1)в прямоугольной системе координат построить эмпирические ломаные регрессии Y на X и X на Y, сделать предположение в виде корреляционной связи;
2)оценить тесноту линейной корреляционной связи;
3)проверить гипотезу о значимости выборочного коэффициента корреляции, при уровне значимости α=0,05;
4)составить линейные уравнения регрессии У на X и X на У, построить их графики в одной системе координат;
5)используя полученные уравнения регрессии, оценить ожидаемое среднее значение признака Y при х=40 чел. Дать экономическую интерпретацию полученных результатов.
Решение.
1. Для построения эмпирических ломаных регрессии вычислим условные
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
средние Yx и X y |
Вычисляем Yx . |
Так как при х = 5 признак Y имеет |
|||||||||||||||||||||||||||||||||||
распределение |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
130 |
132 |
|
|
134 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
ni |
7 |
2 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
130 |
7 |
132 |
|
2 |
|
|
134 1 |
|
|
|||||||||||
|
то условное среднее Yx |
5 |
|
|
130,8. |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
7 |
2 |
1 |
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
При х = 15 признак Y имеет распределение |
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
130 |
132 |
|
134 |
136 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
ni |
1 |
7 |
|
|
|
5 |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
130 1 |
|
132 |
7 |
|
|
134 |
|
5 |
136 1 |
|
|
|
|
|
||||||||||||||||||
тогда Yx |
15 |
|
|
|
132,86. |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
14 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
Аналогично вычисляются все Y X |
и X Y |
. Получим таблицы, выражающие |
|||||||||||||||||||||||||||||||||||
корреляционную зависимость Y от X, (табл.3) и X от Y (табл.4). |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 3 |
|
|
|
|
|
|
Х |
|
|
|
|
5 |
|
|
|
15 |
|
|
|
|
|
|
25 |
|
|
|
|
35 |
|
|
45 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
130,8 132,86 |
|
|
|
135,74 |
137,08 |
|
137,86 |
|
||||||||||||||||
|
|
|
|
|
|
Y X |
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 4 |
|
|
|
|
|
|
Y |
|
|
|
|
130 |
|
132 |
|
|
134 |
|
|
|
136 |
|
138 |
140 |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
6,25 |
|
14 |
|
|
|
19,54 |
|
32,35 |
39 |
|
43,57 |
|
||||||||||||
|
|
|
|
|
|
|
X Y |
|
|
|
|
|
|
|
|||||||||||||||||||||||
В прямоугольной системе координат построим точки Аi(хi,YXi ), соединим их отрезками, получим эмпирическую линию регрессии Y на X. Аналогично строятся точки В j( X Y j ,yj) и эмпирическая линия регрессии X
на Y (см. рис. 1).
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У х (У ) |
|
|
|
|
|
|
|
|
|
В6 |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
139 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А4 |
В5 |
А5 |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
А3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А2 |
В3 |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
А1 |
|
|
В2 |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
130 |
|
|
|
В1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
10 |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
Х ( ХУ ) |
|||||||||
|
|
|
||||||||||||||||
Рис. 1
Построенные эмпирические ломаные регрессии Y на X и X на Y свидетельствуют о том, что между количеством работающих (X) и объёмом складских реализаций (Y) существует линейная зависимость. Из
графика видно, что с увеличением X, Y X также увеличивается, поэтому можно выдвинуть гипотезу о прямой линейной корреляционной зависимости между количеством работающих и объёмом складских реализаций.
2. Оценим тесноту связи. Вычислим выборочный коэффициент корреляции.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi n x |
|
|
|
|
|
|
|
|
|
y j n y |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
r |
|
xy x y |
, |
|
|
|
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
, |
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
y |
|
|
|
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
y |
|
|
|
|
|
n |
|
|
|
|
|
n |
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
x2n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y 2j nx |
|
|
|
|
|
|
|
|
|
|
xi y jnij |
|
|
|
|
|||||||
|
|
|
|
|
|
|
x2 |
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
i |
x |
, y |
|
|
|
|
|
|
|
|
|
|
, |
|
xy |
|
|
|
|
|
|
|
|
|
; |
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
n |
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x2 |
|
|
|
|
|
|
|
|
|
|
|
|
y2 |
|
|
|
|
2 ; |
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
x |
|
y |
|
|
|
|
|
|
y |
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
5 10 |
14 14 |
|
|
25 |
|
23 |
|
|
|
35 |
|
24 |
|
45 |
29 |
|
|
29,8 ; |
|
|
|
|
|
|
|
||||||||||||||||||||||||
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
130 |
8 |
132 10 |
134 11 |
|
|
|
|
136 |
34 |
138 |
30 |
140 |
7 |
|
|
; |
|||||||||||||||||||||||||||||||||
y |
|
|
|
|
135,78 |
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
52 |
10 |
142 |
14 |
|
252 |
23 |
|
352 |
24 |
|
|
452 |
29 |
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
x 2 |
|
|
|
|
|
1059 ; |
|
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||