1.2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Мо - это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности.
Конкретное значение моды для интервального ряда рассчитывается по формуле:
(3) где
хМo - нижняя граница модального интервала;
fMo - частота модального интервала;
h - величина модального интервала;
fMo-1 - частота интервала, предшествующего модальному;
fMo+1 - частота интервала, следующего за модальным.
Согласно таблице «структура банков по объему вложений в ценные бумаги» (табл.5) модальным интервалом построенного ряда является интервал 2047 -- 3807 млн. руб. т.к. он имеет наибольшую частоту (f4=14).
Расчет моды по формуле:
Рис. 1
Вывод: Для рассматриваемой совокупности банков наиболее распространенный объем вложения в ценные бумаги характеризуется средней величиной 2686,99 млн. руб.
Медиана Ме - это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой. Кумулята строится по накопленным частотам
Рис.2
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, (4)
где хМе- нижняя граница медианного интервала,
h - величина медианного интервала,
- сумма всех частот,
fМе - частота медианного интервала,
SMе-1 - кумулятивная (накопленная) частота интервала, предшествующего медианному.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 6. Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).
В демонстрационном примере медианным интервалом является интервал 2047-3807 млн. руб., так как именно в этом интервале накопленная частота Sj =24 впервые превышает величину, равную половине численности единиц совокупности ().
Расчет значения медианы по формуле:
Вывод. Половина из исследуемых банков имеют величину вложений в ценные бумаги до 3053 млн. руб., другая половина имеет вложения в ценные бумаги больше чем 3053 млн. руб.
3. Расчет характеристик ряда распределения
Для расчета характеристик ряда распределения , у, у2, Vу на основе табл. 6 строится вспомогательная табл. 7 ( - середина j-го интервала).
Расчетная таблица для нахождения характеристик ряда распределения.
Табл.7
|
№ группы |
группа банков по объему вложений в ценные бумаги |
середина интервала |
Число банков |
|
|
|
||
|
1 |
287 - 2047 |
1167 |
10 |
11670 |
-2200 |
4840000 |
48400000 |
|
|
2 |
2047 - 3807 |
2927 |
14 |
40978 |
-440 |
193600 |
2710400 |
|
|
3 |
3807 - 5567 |
4687 |
7 |
32809 |
1320 |
1742400 |
12196800 |
|
|
4 |
5567 - 7327 |
6447 |
3 |
19341 |
3080 |
9486400 |
28459200 |
|
|
5 |
7327 - 9087 |
8207 |
2 |
16414 |
4840 |
23425600 |
46851200 |
|
|
|
итого |
|
36 |
121212 |
|
|
138617600 |
Расчет средней арифметической взвешенной:
(5)
Расчет среднего квадратического отклонения:
млн. руб. (6)
Расчет дисперсии:
у2 = 1962,266=3850487,855
Расчет коэффициента вариации:
(7)
Вывод. Анализ полученных значений показателей и у говорит о том, что средний объем вложений в ценные бумаги составляет , отклонение от среднего объема в ту или иную сторону составляет в среднем млн.руб. (или 58,3%). наиболее характерные значения объема вложений в ценные бумаги находятся в пределах от 1404,73 млн руб. до 5329,27 млн руб. (диапазон ).
Значение Vу = 58,28% превышает 33%, следовательно, вариация вложений в ценные бумаги в исследуемой совокупности банков значительна и совокупность по данному признаку неоднородна. Расхождение между значениями , Мо и Ме значительно (=3367 млн руб., Мо=2687 млн руб., Ме=3053млн руб.), что подтверждает вывод о неоднородности совокупности банков. Таким образом, найденное среднее значение объема кредитных вложений банков не является типичной, надежной характеристикой исследуемой совокупности банков.
4.Вычисление средней арифметической по исходным данным
Для расчета применяется формула средней арифметической простой:
, (8)
Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 36-ти банков, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).
Задание 2
По исходным данным табл. 1 с использованием результатов выполнения Задания 1 необходимо выполнить следующее:
1. Установить наличие и характер корреляционной связи между признаками вложения в ценные бумаги и прибыль, используя метод аналитической группировки и корреляционной таблицы.
2. Оценить тесноту и силу корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение.
3. Оценить статистическую значимость показателя силы связи.
Сделать выводы по результатам выполнения Задания 2.
Выполнение Задания 2.
Целью выполнения данного Задания является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи, оценка тесноты и силы связи.
Факторный и результативный признаки либо задаются в условии задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.
По условию Задания 2 факторным является признак вложения в ценные бумаги (X), результативным - признак прибыль (Y).
1. Установление наличия и характера связи между признаками вложения в ценные бумаги и прибыль методами аналитической группировки и корреляционной таблицы
Применение метода аналитической группировки.
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную таблицу 4, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х - вложения в ценные бумаги и результативным признаком Y - прибыль. Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет
табл. 8
|
№ группы |
Группы банков по объему вложения в ценные бумаги, млн.руб. x |
Число банков |
Сумма прибыли |
||
|
Всего |
в среднем на один банк 5=4:3 |
||||
|
1 |
2 |
3 |
4 |
5 |
|
|
1 |
287 - 2047 |
10 |
1379 |
137,900 |
|
|
2 |
2047 - 3807 |
14 |
3150 |
225,000 |
|
|
3 |
3807 - 5567 |
7 |
1616 |
230,857 |
|
|
4 |
5567 - 7327 |
3 |
1062 |
354,000 |
|
|
5 |
7327 - 9087 |
2 |
880 |
440,000 |
|
|
Итого |
36 |
8087 |
224,639 |
Вывод. Анализ данных табл. 8 показывает, что с увеличением объема вложений в ценные бумаги от группы к группе систематически возрастает и средняя прибыль по каждой группе банков, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
Применение метода корреляционной таблицы.
Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х известны из табл. 8. Для результативного признака у - прибыль величина интервала определяется по формуле:
, (из табл.1)
млн.руб.
Границы интервалов ряда распределения признака Y
Табл.9
|
№ группы |
Нижняя граница млн.руб. |
Верхняя граница млн.руб |
|
|
1 |
11 |
138,8 |
|
|
2 |
138,8 |
266,6 |
|
|
3 |
266,6 |
394,4 |
|
|
4 |
394,4 |
522,2 |
|
|
5 |
522,2 |
650 |
Подсчитывая число банков, входящих в каждую группу (частоты групп), получаем интервальный ряд распределения результативного признака (табл. 10).
Распределение банков по сумме прибыли
Табл.10
|
группы банков по сумме прибыли млн.руб |
число банков |
|
|
11 - 138,8 |
14 |
|
|
138,8 - 266,6 |
10 |
|
|
266,6 - 394,4 |
4 |
|
|
394,4 - 522,2 |
5 |
|
|
522,2 - 650 |
3 |
|
|
итого |
36 |
Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).
Корреляционная таблица зависимости суммы прибыли банков от объема кредитных вложений
Табл.11
|
группы банков по объему вложений в ценные бумаги, млн.руб. |
Группы банков по сумме прибыли, млн.руб. |
||||||
|
11 - 138,8 |
138,8 - 266,6 |
266,6 - 394,4 |
394,4 - 522,2 |
522,2 - 650 |
итого |
||
|
287 - 2047 |
8 |
1 |
1 |
10 |
|||
|
2047 - 3807 |
3 |
6 |
3 |
2 |
14 |
||
|
3807 - 5567 |
3 |
2 |
2 |
7 |
|||
|
5567 - 7327 |
2 |
1 |
3 |
||||
|
7327 - 9087 |
2 |
2 |
|||||
|
итого |
14 |
20 |
4 |
5 |
3 |
36 |
Вывод. Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между объемом кредитных вложений и суммой прибыли банков.
2. Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели - эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где - общая дисперсия признака Y,
- межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле