Курсовая работа: Статистический анализ банковской деятельности

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

, (10)

где yi - индивидуальные значения результативного признака;

- общая средняя значений результативного признака;

n - число единиц совокупности.

Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:

(11)

или как средняя взвешенная по частоте групп интервального ряда:

(12)

Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.

Расчет по формуле (12):

Для расчета общей дисперсии применяется вспомогательная таблица 12

Табл.12

№ банка п\п

Прибыль млн.руб.

1

2

3

4

5

1

110

-114,639

13142,100

12100

2

538

-313,361

98195,116

289444

3

85

-139,639

19499,050

7225

4

60

-164,639

27106,000

3600

5

39

-185,639

34461,838

1521

6

153

-71,639

5132,146

23409

7

215

-9,639

92,910

46225

8

224

-0,639

0,408

50176

9

203

-21,639

468,246

41209

10

64

-160,639

25804,888

4096

11

11

-213,639

45641,622

121

12

153

-71,639

5132,146

23409

13

121

-103,639

10741,042

14641

14

94

-130,639

17066,548

8836

15

105

-119,639

14313,490

11025

16

93

-131,639

17328,826

8649

17

329

104,361

10891,218

108241

18

451

226,361

51239,302

203401

19

439

214,361

45950,638

192721

20

441

216,361

46812,082

194481

21

237

12,361

152,794

56169

22

282

57,361

3290,284

79524

23

191

-33,639

1131,582

36481

24

201

-23,639

558,802

40401

25

12

-212,639

45215,344

144

26

77

-147,639

21797,274

5929

27

282

57,361

3290,284

79524

28

451

226,361

51239,302

203401

29

50

-174,639

30498,780

2500

30

306

81,361

6619,612

93636

31

440

215,361

46380,360

193600

32

204

-20,639

425,968

41616

33

63

-161,639

26127,166

3969

34

650

425,361

180931,980

422500

35

538

313,361

98195,116

289444

36

175

-49,639

2464,030

30625

Итого

8087

7862,361

1007338,306

2823993

Расчет общей дисперсии по формуле (10):

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле

, (13)

где -групповые средние,

- общая средняя,

-число единиц в j-ой группе,

k - число групп.

Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).

Вспомогательная таблица для расчета межгрупповой дисперсии

Таб. 13

группы банков по объемам вложений в ценные бумаги

число банков

среднее значение в группе

287 - 2047

10

137,900

-86,739

75236,5412

2047 - 3807

14

225,000

0,361

1,824494

3807 - 5567

7

230,857

6,218

270,657104

5567 - 7327

3

354,000

129,361

50202,805

7327 - 9087

2

440,000

215,361

92760,7206

итого

36

224,639

218472,548

Расчет межгрупповой дисперсии по формуле (11):

Расчет эмпирического коэффициента детерминации по формуле (9):

или 21,69%

Вывод: 21,69 вариации суммы прибыли банков обусловлено вариацией объема вложений в ценные бумаги, а 78,31% - влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

(14)

Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):

Шкала Чэддока

Табл.14

0,1 - 0,3

0,3 - 0,5

0,5 - 0,7

0,7 - 0,9

0,9 - 0,99

Характеристика

силы связи

Слабая

Умеренная

Заметная

Тесная

Весьма тесная

Расчет эмпирического корреляционного отношения по формуле (14):

или 46,57%

Вывод. Согласно шкале Чэддока связь между объемом вложений в ценные бумаги и суммой прибыли банков является умеренной.

3. Оценка статистической значимости коэффициента детерминации .

Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.

Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле

,

где n - число единиц выборочной совокупности,

m - количество групп,

- межгрупповая дисперсия,

- дисперсия j-ой группы (j=1,2,…,m),

- средняя арифметическая групповых дисперсий.

Величина рассчитывается, исходя из правила сложения дисперсий:

,

где - общая дисперсия.

Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m: k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).

Если FрасчFтабл, коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.

Если FрасчFтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.

Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:

k2

k1

24

25

26

27

28

29

30

31

32

33

34

35

3

3,01

2,99

2,98

2,96

2,95

2,93

2,92

2,91

2,90

2,89

2,88

2,87

4

2,78

2,76

2,74

2,73

2,71

2,70

2,69

2,68

2,67

2,66

2,65

2,64

5

2,62

2,60

2,59

2,57

2,56

2,55

2,53

2,52

2,51

2,50

2,49

2,48

Расчет дисперсионного F-критерия Фишера для оценки =21,69%, полученной при =27981,62, =6068,682:

Табличное значение F-критерия при = 0,05:

n

m

36

5

4

31

2,86

Вывод: поскольку , то величина коэффициента детерминации считается статистически незначимым, и следовательно, оценки силы связи между признаками объема вложений в ценные бумаги и суммой прибыли банков относятся только к выборке, и нельзя распространить на генеральную совокупность.

Задание 3

По результатам выполнения задания 1 с вероятностью 0,954 определите:

1. Ошибку выборки средней величины вложения средств банками в ценные бумаги и границы, в которых будет находиться средняя величина вложений в генеральной совокупности.

2. Ошибку выборки доли банков с вложениями средств в ценные бумаги 3811 млн. руб. и более и границы, в которых будет находиться генеральная доля.

Выполнение Задания 3

Целью выполнения данного Задания является определение для генеральной совокупности коммерческих банков региона границ, в которых будут находиться величина среднего объема вложений в ценные бумаги и доля банков с вложениями средств в ценные бумаги с объемом не менее 3811 млн руб.

1. Определение ошибки выборки средней величины вложения средств банками в ценные бумаги и границы, в которых будет находиться средняя величина вложений в генеральной совокупности.

Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину е, которую называют ошибкой выборки (ошибкой репрезентативности).

Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю и предельную .

Средняя ошибка выборки - это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[].

Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле

, (15)

где - общая дисперсия выборочных значений признаков,

N - число единиц в генеральной совокупности,

n - число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:

,

, (16)

где - выборочная средняя,

- генеральная средняя.

Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.

В экономических исследованиях чаще всего используются доверительные вероятности Р= 0.954, Р= 0.997, реже Р= 0,683.

В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке µ с коэффициентом кратности t (называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней это теоретическое положение выражается формулой

(17)

Значения t вычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл. 15):