, (10)
где yi - индивидуальные значения результативного признака;
- общая средняя значений результативного признака;
n - число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
(12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (12):
Для расчета общей дисперсии применяется вспомогательная таблица 12
Табл.12
|
№ банка п\п |
Прибыль млн.руб. |
||||
|
1 |
2 |
3 |
4 |
5 |
|
|
1 |
110 |
-114,639 |
13142,100 |
12100 |
|
|
2 |
538 |
-313,361 |
98195,116 |
289444 |
|
|
3 |
85 |
-139,639 |
19499,050 |
7225 |
|
|
4 |
60 |
-164,639 |
27106,000 |
3600 |
|
|
5 |
39 |
-185,639 |
34461,838 |
1521 |
|
|
6 |
153 |
-71,639 |
5132,146 |
23409 |
|
|
7 |
215 |
-9,639 |
92,910 |
46225 |
|
|
8 |
224 |
-0,639 |
0,408 |
50176 |
|
|
9 |
203 |
-21,639 |
468,246 |
41209 |
|
|
10 |
64 |
-160,639 |
25804,888 |
4096 |
|
|
11 |
11 |
-213,639 |
45641,622 |
121 |
|
|
12 |
153 |
-71,639 |
5132,146 |
23409 |
|
|
13 |
121 |
-103,639 |
10741,042 |
14641 |
|
|
14 |
94 |
-130,639 |
17066,548 |
8836 |
|
|
15 |
105 |
-119,639 |
14313,490 |
11025 |
|
|
16 |
93 |
-131,639 |
17328,826 |
8649 |
|
|
17 |
329 |
104,361 |
10891,218 |
108241 |
|
|
18 |
451 |
226,361 |
51239,302 |
203401 |
|
|
19 |
439 |
214,361 |
45950,638 |
192721 |
|
|
20 |
441 |
216,361 |
46812,082 |
194481 |
|
|
21 |
237 |
12,361 |
152,794 |
56169 |
|
|
22 |
282 |
57,361 |
3290,284 |
79524 |
|
|
23 |
191 |
-33,639 |
1131,582 |
36481 |
|
|
24 |
201 |
-23,639 |
558,802 |
40401 |
|
|
25 |
12 |
-212,639 |
45215,344 |
144 |
|
|
26 |
77 |
-147,639 |
21797,274 |
5929 |
|
|
27 |
282 |
57,361 |
3290,284 |
79524 |
|
|
28 |
451 |
226,361 |
51239,302 |
203401 |
|
|
29 |
50 |
-174,639 |
30498,780 |
2500 |
|
|
30 |
306 |
81,361 |
6619,612 |
93636 |
|
|
31 |
440 |
215,361 |
46380,360 |
193600 |
|
|
32 |
204 |
-20,639 |
425,968 |
41616 |
|
|
33 |
63 |
-161,639 |
26127,166 |
3969 |
|
|
34 |
650 |
425,361 |
180931,980 |
422500 |
|
|
35 |
538 |
313,361 |
98195,116 |
289444 |
|
|
36 |
175 |
-49,639 |
2464,030 |
30625 |
|
|
Итого |
8087 |
7862,361 |
1007338,306 |
2823993 |
Расчет общей дисперсии по формуле (10):
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где -групповые средние,
- общая средняя,
-число единиц в j-ой группе,
k - число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Вспомогательная таблица для расчета межгрупповой дисперсии
Таб. 13
|
группы банков по объемам вложений в ценные бумаги |
число банков |
среднее значение в группе |
|||
|
287 - 2047 |
10 |
137,900 |
-86,739 |
75236,5412 |
|
|
2047 - 3807 |
14 |
225,000 |
0,361 |
1,824494 |
|
|
3807 - 5567 |
7 |
230,857 |
6,218 |
270,657104 |
|
|
5567 - 7327 |
3 |
354,000 |
129,361 |
50202,805 |
|
|
7327 - 9087 |
2 |
440,000 |
215,361 |
92760,7206 |
|
|
итого |
36 |
224,639 |
218472,548 |
Расчет межгрупповой дисперсии по формуле (11):
Расчет эмпирического коэффициента детерминации по формуле (9):
или 21,69%
Вывод: 21,69 вариации суммы прибыли банков обусловлено вариацией объема вложений в ценные бумаги, а 78,31% - влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Шкала Чэддока
Табл.14
|
|
0,1 - 0,3 |
0,3 - 0,5 |
0,5 - 0,7 |
0,7 - 0,9 |
0,9 - 0,99 |
|
|
Характеристика силы связи |
Слабая |
Умеренная |
Заметная |
Тесная |
Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
или 46,57%
Вывод. Согласно шкале Чэддока связь между объемом вложений в ценные бумаги и суммой прибыли банков является умеренной.
3. Оценка статистической значимости коэффициента детерминации .
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
,
где n - число единиц выборочной совокупности,
m - количество групп,
- межгрупповая дисперсия,
- дисперсия j-ой группы (j=1,2,…,m),
- средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
,
где - общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m: k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если FрасчFтабл, коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если FрасчFтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:
|
k2 |
|||||||||||||
|
k1 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
|
|
3 |
3,01 |
2,99 |
2,98 |
2,96 |
2,95 |
2,93 |
2,92 |
2,91 |
2,90 |
2,89 |
2,88 |
2,87 |
|
|
4 |
2,78 |
2,76 |
2,74 |
2,73 |
2,71 |
2,70 |
2,69 |
2,68 |
2,67 |
2,66 |
2,65 |
2,64 |
|
|
5 |
2,62 |
2,60 |
2,59 |
2,57 |
2,56 |
2,55 |
2,53 |
2,52 |
2,51 |
2,50 |
2,49 |
2,48 |
Расчет дисперсионного F-критерия Фишера для оценки =21,69%, полученной при =27981,62, =6068,682:
Табличное значение F-критерия при = 0,05:
|
n |
m |
||||
|
36 |
5 |
4 |
31 |
2,86 |
Вывод: поскольку , то величина коэффициента детерминации считается статистически незначимым, и следовательно, оценки силы связи между признаками объема вложений в ценные бумаги и суммой прибыли банков относятся только к выборке, и нельзя распространить на генеральную совокупность.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,954 определите:
1. Ошибку выборки средней величины вложения средств банками в ценные бумаги и границы, в которых будет находиться средняя величина вложений в генеральной совокупности.
2. Ошибку выборки доли банков с вложениями средств в ценные бумаги 3811 млн. руб. и более и границы, в которых будет находиться генеральная доля.
Выполнение Задания 3
Целью выполнения данного Задания является определение для генеральной совокупности коммерческих банков региона границ, в которых будут находиться величина среднего объема вложений в ценные бумаги и доля банков с вложениями средств в ценные бумаги с объемом не менее 3811 млн руб.
1. Определение ошибки выборки средней величины вложения средств банками в ценные бумаги и границы, в которых будет находиться средняя величина вложений в генеральной совокупности.
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину е, которую называют ошибкой выборки (ошибкой репрезентативности).
Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю и предельную .
Средняя ошибка выборки - это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[].
Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.
Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле
, (15)
где - общая дисперсия выборочных значений признаков,
N - число единиц в генеральной совокупности,
n - число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:
,
, (16)
где - выборочная средняя,
- генеральная средняя.
Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.
В экономических исследованиях чаще всего используются доверительные вероятности Р= 0.954, Р= 0.997, реже Р= 0,683.
В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке µ с коэффициентом кратности t (называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней это теоретическое положение выражается формулой
(17)
Значения t вычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл. 15):