Материал: Корреляционный анализ и анализ динамических рядов

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам


.5 Расчет и построение теоретической линии регрессии

Теоретическая линия регрессии представляет собой такую математически правильную кривую (любую прямую) линию, которая проходит наиболее близко к точкам эмпирической линии регрессии, выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.

В данном случае характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи у от х у = а0 + а1х

Параметры искомой прямой (а0, а1) нахожу из системы уравнений по способу наименьших квадратов:


Исходную информацию для решения данной системы получаем из таблицы "Расчет теоретической линии регрессии для зависимости у от х", которая основана на результатах таблицы "Расчет эмпирической линии регрессии для зависимости у от х".

Для получения упрощенных вариантов по факторному признаку используется метод отсчета от условного нуля. В данном примере сх = 112 чел., iх = 6.

Расчет теоретической линии регрессии для зависимости у от х

Объем СМР, тыс. руб.

 Среднегодовая стоимость основных фондов тыс.руб.

№ столбца


y'

x'2

25

16

9

4

1

0

1

4

9

16

25

1

2

3

4



x'

-5

-4

-3

-2

-1

0

1

2

3

4

5

li

liy'

y'2

liy'2



x y

70

76

83

120

122

112

116

115

119

126

 130






6

180

1











1

6

36

36


5

172


1










1

5

25

25


4

164












0

0

16

0


3

156




1








1

3

9

9


2

148












0

0

4

0


1

140












0

0

1

1


0

132












0

0

0

0


- 1

124








1




1

-1

1

1


- 2

116








1

1



2

-4

4

8


- 3

108



1





1


1


3

-9

9

27


- 4

100










1

1

2

-8

16

32


1

Итого hi

1

1

1

1

0

0

0

3

1

2

1

n = 11

Σy' = -8

-

Σy'2 = 139


2

Σ hix'

-5

-4

-3

-2

0

0

0

6

3

8

5

Σ x' = 8


3

Σ hix'2

25

16

9

4

0

0

0

12

9

32

25

Σ x'2 = 132


4

Σ miy'i

6

5

-3

3

0

0

0

-6

-2

-7

-4

Σy' = -8


5

Σ miy'iх'i

-30

-20

9

-6

0

0

0

-12

-6

-28

-20

Σy'х' = -113



Результаты расчетов приведены в таблице "Расчет теоретической линии регрессии для зависимости у от х".

В систему уравнений подставляем результаты, полученные в таблице "Расчет теоретической линии регрессии для зависимости у от х":


В качестве метода решения данной системы принимаем метод Гаусса, который позволяет находить решения последовательно, исключая неизвестные. Для этого 1-ое уравнение системы делим на -8, а 2-ое уравнение - на 132.


Сложим уравнения полученной системы:

,314а'0 = 0,144

Откуда:

а'0 = -0,109

Затем подставляем в уравнение а'0 и находим величину а'1:

,375 * (-0,109) - а'1 = 1

а'1 = -0,850

Параметры а'0 и а'1 необходимо преобразовать исходя из фактических значений х и у.

Формулы перевода из упрощенных в реальные координаты:


где iy - интервал группировки по функции;- интервал группировки по аргументу;- новое начало отсчета по функции;- новое начало отсчета по аргументу.

Находим:

а0 = 258,125; а1 = -1,288

Уравнение теоретической линии регрессии в реальных коэффициентах имеет вид:

у = 258,125 - 1,288х.

В уравнении регрессии первое слагаемое носит название свободного члена, второе слагаемое называется коэффициентом регрессии. Он показывает, на сколько натуральных единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.

Вывод: из уравнения теоретической линии регрессии видно, что объем СМР понижается на 1,288% при увеличении численности на 1%.

Объем СМР, не зависящий от рассматриваемых факторов, равен 1433,7 тыс. руб.

Для графического изображения линии регрессии, рассчитанной по линейной гипотезе, достаточно определить две точки, через которые можно провести прямую.

В данной курсовой проводим на поле корреляции прямую линию.

Графическое изображение теоретической линии регрессии в виде уравнения прямой еще раз подтверждает наличие корреляционной связи между изучаемыми признаками


2. Определение показателей вариации

Если всю изучаемую совокупность разделить на группы, то можно рассчитать следующие виды дисперсий:

-  групповую дисперсию;

-  среднюю из групповых дисперсий;

-  межгрупповую дисперсию;

-       общую дисперсию по правилу сложения дисперсий.

Рассмотрим на примере влияния численности работников на накладные расходы выше перечисленные виды дисперсий. По данным первого задания работы выделим три группы по результативному признаку - объем смр (тыс. руб.) и вычислим следующее:

.1 Групповая дисперсия

Группировочным или факторным признаком является среднегодовая стоимость основных средств (тыс. руб.), т.е. мы разбиваем изучаемую совокупность на три группы:

1)   Среднегодовая стоимость от 70 до 95 тыс. руб.

2)   Среднегодовая стоимость от 95 до 120 тыс. руб.

3)   Среднегодовая стоимость от 120 и более тыс. руб.

Объемы смр является результативным признаком (у), который зависит от изменения среднегодовой стоимости.

Среднегодовая стоимость от 70 до 95 тыс.руб.

Среднегодовая стоимость от 95 до 120 тыс.руб

Среднегодовая стоимость от 120 и более тыс.руб


Объем смр

yi - y

(yi - y)2


Объем смр

yi - y

(yi - y)2


Объем смр

yi - y

(yi - y)2

1

100

-5,67

32,15

1

118

-31,6

998,56

1

149

-17,34

300,68

2

108

 2,33

5,43

2

152

2,4

2,76

2

170

3,66

13,4

3

109

 3,33

11,09

153

3,4

11,56

3

180

13,66

186,6

4





160

10,4

108,16





5





165

15,4

237,16





317


48,66

748


1361,2

499


500,68

у

105,67



у

149,6



у

166,34



σ2



16,22

σ2



272,24

σ2



166,89



По третьей группе разброс меньше (отклонение от средней величины 329,68 тыс. руб.)

.2 Средняя из групповых

Характеризует случайную вариацию, возникшую под влиянием других, неучтенных факторов, и не зависит от условия (факторного признака - численность работников), положенного в основу группировки.

Определим среднюю из групповых дисперсий, которая показывает вариацию накладных расходов, вызванную всеми различными факторами, кроме накладных расходов, но в среднем по всей совокупности по формуле средней арифметической взвешенной:


2.3 Межгрупповая дисперсия

Отражает вариацию изучаемого признака, которая возникает под влиянием признака, положенного в основу группировки (факторный признак - численность работников).

Определим межгрупповую дисперсию, которая характеризует вариацию групповых средних величин, обусловленную различиями групп по численности работников.


где у - средняя по всей изучаемой совокупности


.4 Общая дисперсия

Указанные выше дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии.

Это тождество отражает правило сложения дисперсий. Опираясь на это правило, можно определить, какая доля общей дисперсии складывается под влиянием признака, положенного в основу группировки.

Определим общую дисперсию:

σ2 = σ2 + δ2

σ2 = 173,69 + 527,94 = 701,63

2.5 Среднее квадратическое отклонение

Среднее квадратическое отклонение является мерилом надежности средней величины. Среднее квадратическое отклонение определяется по формуле:

2.6 Показатель вариации

Для оценки однородности совокупности используется коэффициент вариации по факторным признакам


Если коэффициент вариации не превышает 33%, совокупность считается однородной, а средняя величина типичной и приемлемой для прогнозных оценок. В противном случае в изучаемой совокупности большая колеблемость признака.

В данной курсовой Кv < 33, следовательно, совокупность однородная.

2.7 Анализ выполненных расчетов и вывод

Для определения показателей вариации были выбраны три группы по результативному признаку и вычислены показатели вариации. Показателями вариации являются: групповая дисперсия, средняя из групповых, межгрупповая дисперсия и общая дисперсия.

Наименьшее изменение накладных расходов вызывает первая группа.

Средняя из групповых показывает, что изменение объема смр, в среднем, по всем трем группам составляет 173,69 тыс. руб. Влияние группировочного признака здесь также не учитывается.

Общая дисперсия говорит о том, что среднегодовая стоимость основных фондов (группировочный признак) оказывает сильное влияние на объем смр, так как доля межгрупповой дисперсии больше в общей дисперсии, чем средней из групповой.

Изучаемая совокупность считается однородной, так как коэффициент вариации меньше 33% и составляет 18,63%.

3. Анализ динамических рядов

.1 Определение данных для 3-го динамического ряда по двум исходным данным

Исходные данные:

Годы

Фонд зарплаты, тыс. руб.

Среднесписочная численность работников, чел

Средняя заработная плата, тыс. руб.


1

2

3

1991

140

101

1,39

1992

150

85

1,77

1993

160

39

4,1

1994

161

140

1,15

1995

178

141

1,26

1996

237

142

1,67

1997

244

142

1,72

1998

294

143

2,06


.2 Установление вида ряда динамики

Динамикой в статистике называют изменения явления во времени. Для отображения динамики строят ряды динамики, которые представляют собой ряды изменяющихся во времени значений статистического показателя, расположенных в хронологическом порядке.

Ряд динамики состоит из двух элементов: момента или периода времени, к которым относятся данные, и статистических показателей. Оба элемента вместе образуют члены ряда.

Существуют различные виды рядов динамики. В зависимости от способа выражения уровней ряда динамики они подразделяются на ряды абсолютных величин, относительных величин и средних величин.

По длительности времени, к которым относятся уровни ряда, ряды динамики делятся на моментные и интервальные. В моментных рядах каждый уровень характеризует явления на момент времени, а в интервальных рядах динамики каждый уровень ряда характеризует явление за период времени.

Также ряды динамики могут быть с равными и неравными интервалами. В данной курсовой работе представлены интервальные ряды с равными промежуточными интервалами в 1 год.

.3 Определение среднего уровня динамики

Средний уровень ряда динамики вычисляется по формуле:


где у - абсолютный уровень ряда;- число уровней.