Материал: Методы статистического анализа и прогнозирования

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Статистика

Наука Практическая деятельность Цифровые данные

Немецкий ученый Готфрид Ахенваль (1719 - 1772) впервые употребил слово "статистика" в его современном значении. Слова "статистический" и "статистика" в XVIII в. немецкие ученые стали использовать, подразумевая под ними совокупность знаний о государственных достопримечательностях или описании разных государств (государствоведение). Статистические исследования проводят в 3 этапа:

  1. Сбор статистических данных

  2. Сводка и группировка статистических данных

  3. Расчет обобщающих статистических показателей, их анализ и прогнозирование

Задание 1. Проведение сводки и группировки данных.

Сводка

Сводка – переход от единичных фактов к общим положениям. Статистическая сводка – систематизация единичных фактов, позволяющая перейти к обобщающим показателям. Результатом сводки является группировка.

Группировка

Под группировкой понимают разделение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения структуры и взаимосвязей.

Виды группировок

  1. Структурные – это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку.

  2. Типологические предназначены для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам.

  3. Аналитические предназначены для выявления зависимости между признаками.

Техника проведения группировки

Включает в себя следующие этапы:

  1. Выбор группировочного признака или их комбинаций

  2. Определение оптимального количества групп, которое осуществляется на основе формулы Стерджесса

, где n – количество групп, N – численность совокупности

  1. Расчет величины интервала

, где Xmax, Xmin – максимальное/минимальное значение признака у единиц статистической совокупности

  1. Определение границ интервалов

  2. Оформление результатов группировки в статистическую таблицу

После проведения группировки изучают вариацию признака в совокупности (различие в величине признака) и корреляцию, т.е. зависимость результатов показателя от фактора величины.

Для изучения вариации применяется система абсолютных и относительных показателей.

Относительная величина – показатель, получаемый путем отношения 2 социально-экономических показателей.

Абсолютные показатели вариации

  1. Размах вариации

, где Xmax, Xmin – максимальное/минимальное значение признака у единиц статистической совокупности

  1. Среднее линейное отклонение

- для не сгруппированных данных

– для сгруппированных данных

где f – частота повтора признака в каждой группе

  1. Дисперсия

- для не сгруппированных данных

– для сгруппированных данных

  1. Среднее квадратичное отклонение

Относительные показатели вариации

  1. Относительное линейное отклонение

  1. Коэффициент вариации

Если V > 33%, то совокупность считается разнородной.

Изучение корреляции

Корреляционная связь – это тип связи, которая между факторным и результативным признаком проявляется лишь в среднем при массовом статистическом наблюдении.

Все социально-экономические явления подвержены корреляционным связям. В них нет чистого соответствия между изменением результата показателя и изменением факторной величины. Для изучения корреляции используется метод построения уравнения регрессии, которая для 2х признаков (x – факторный, y – результативный признак) имеет следующий вид:

Параметр a1 называют коэффициентом регрессии, который показывает направление связи между признаками.

Если a1 > 0, то связь прямая (при ) Если a1 < 0, то связь обратная (при )

Экономическое содержание коэффициента регрессии состоит в том, что он показывает на сколько единиц в натуральном выражении измеряется результативный показатель при изменении факторного признака на 1 натуральную единицу своего измерения.

На основе уравнения регрессии рассчитывается коэффициент эластичности, который показывает на сколько % изменится результативный признак при изменении факторного на 1%.

Корреляция может быть изучена на основе линейного коэффициента корреляции:

где S(x), S(y) – среднее квадратичное отклонение для факторов x и y.

В соответствии со шкалой Чеддока, если r находится в границах:

Значение коэффициента корреляции при наличии

Теснота связи

Прямой связи

Обратной связи

0,1 – 0,3

(-0,3) – (-0,1)

Слабая

0,3 – 0,5

(-0,5) – (-0,3)

Умеренная

0,5 – 0,7

(-0,7) – (-0,5)

Заметная

0,7 – 0,9

(-0,9) – (-0,7)

Тесная

0,9 – 0,99

(-0,99) – (-0,9)

Очень тесная

Практическая работа №1. Вариант 14.

x

y

1

43

81

2

64

199

3

94

343

4

115

486

5

135

617

6

146

774

7

105

382

8

197

1218

9

248

2458

10

53

121

  1. Определить оптимальное количество группы

n = 1 + 3,3322 ln N

n = 1 + 3,3322 ln 10 = 4

  1. Расчет величины интервала (по X)

  1. Найдем границы интервала

43 --- 94

94 --- 146

146 --- 197

197 --- 248

(4 интервала, т. к. n = 4)

  1. Статистическая таблица

Границы

N предприятий

Количество предприятий

∑y

43 --- 94

1, 2, 3, 10

4

744

186

94 --- 146

4, 5, 6, 7

4

2259

564,75

146 --- 197

8

1

1318

1218

197 --- 248

9

1

2458

2458

N – предприятия, значения которых входит в интервал

∑y – сумма y по N предприятий

y̅ = ∑y / количество предприятий

Вывод: аналитическая группировка позволяет выяснить, что с ростом расходов предприятия на тех. нужды происходит увеличение получаемой прибыли.

Границы

Кол-во, f

Серед. инт., x

x * f

|x-x̅|

|x-x̅|* f

(x-x̅)2

(x-x̅)2 * f

43 --- 94

4

68,50

274,00

46,30

185,20

2143,69

8574,76

94 --- 146

4

120,00

480,00

5,20

20,80

27,04

108,16

146 --- 197

1

171,50

171,50

56,70

56,70

3214,89

3214,89

197 --- 248

1

222,50

222,50

107,70

107,70

11599,29

11599,29

Итого

10

582,50

1148,00

215,90

370,40

16984,91

23497,10

Абсолютные показатели вариации

  1. Размах вариации

  1. Среднее линейное отклонение

  1. Дисперсия

  1. Среднее квадратическое отклонение

Относительные показатели вариации

  1. Относительное линейное отклонение

  1. Коэффициент вариации

Совокупность разнородная.

f

 

 

4

 

 

 

3

 

 

 

2

 

 

 

 

 

1

 

 

 

 

 

 

43

94

146

197

248

X

Распределение доходов предприятия на тех. нужды неоднородно, т. к. показатель больше 33% (составляет 41%). Из графика видно, что наблюдается левосторонняя асимметрия.

Выразим зависимость между результативным показателем и факторным признаком построив регрессионное уравнение.

Нахождение параметров данной модели возможно на основе решения следующей системы нормальных уравнений.

Проведем предварительные расчеты.

N

x

y

x2

xy

(x-x̅)2

(y-y̅)2

1

43

81

1849

3483

5929

344451,61

2

64

199

4096

12736

3136

219867,21

3

94

343

8836

32242

676

105560,01

4

115

486

13225

55890

25

33087,61

5

135

617

18225

83295

225

2590,81

6

146

774

21316

113004

676

11257,21

7

105

382

11025

40110

225

81738,81

8

197

1218

38809

239946

5929

302610,01

9

248

2458

61504

609584

16384

3204458,01

10

53

121

2809

6413

4489

299099,61

Итого

1200

6679

181694

1196703

37694

4604720,9