Материал: 1749

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

25

интервалов Xi ,Yk , которые будем называть представителями.

В результате вместо предыдущей таблицы получим следующую.

Y

15

20

25

30

35

40

ny

X

 

 

 

 

 

 

 

15

4

1

 

 

 

 

5

25

 

6

4

 

 

 

10

35

 

 

2

50

2

 

54

45

 

 

1

9

7

 

17

55

 

 

 

4

3

7

14

nx

4

7

7

63

12

7

100

Рассмотрим корреляционную таблицу в общем виде, которая связывает переменные величины.

Y

y1

y2

y3

yr

nxi

X

 

 

 

 

 

 

x1

n11

n12

n13

n1r

nx1

x2

n21

n22

n23

n2r

nx2

x3

n31

n32

n33

n3r

nx3

xS

nS1

nS 2

nS 3

nS r

nxS

ny j

ny1

ny2

ny3

nyr

n

Числа nx1, nx2 ,…, nxS характеризуют частоты значений переменной

X во всей совокупности, а сумма их даёт её объём n.

Частота nxi i 1,2, ,s является суммой частот, соответствующих значению Xi при всевозможных значениях y.

Аналогично, числа ny1, ny2 ,…, nyr представляют частоты значений

переменной Y во всей совокупности, а их сумма тоже даёт объём n. Частота ny j j 1,2, ,r является суммой частот, соответствующих значе-

нию Yj при различных значениях x.

Таким образом, сумма всех частот корреляционной таблицы определяет объём выборки n. Объём выборки можно записать в таких различных формах:

S

r

S

r

n ni j

nxi

ny j .

i 1

j 1

i 1

j 1

26

Общая средняя арифметическая переменной X в наших обозначениях запишется так:

 

 

 

S

 

S

 

 

 

 

xinxi

 

xinxi

 

 

 

 

i 1

 

i 1

.

X

 

S

n

 

 

 

nxi

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

Аналогично, общая средняя переменной Y будет равна:

 

 

 

r

 

r

 

 

 

 

yjny j

 

yjny j

 

 

 

 

j 1

 

j 1

.

Y

 

r

n

 

 

 

ny j

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

Корреляционная таблица в общем виде разбита на s групп по числу значений переменной X . В группы объединены те элементы совокупности, у которых переменная X принимает одно и то же значение. В первой группе содержатся элементы, у которых переменная X принимает значение x1, а y– любое из возможных и т.д.

Вычислим средние арифметические переменной Y элементов, содержащихся в отдельных группах. Это будут групповые средние перемен-

 

 

 

 

 

 

r

 

 

 

i i 1,2, s . Тогда

 

 

 

yjni j

 

ной y. Обозначим их через

y

y

i

 

j 1

.

nxi

 

 

 

 

 

 

 

Таким образом, каждому значению xi переменной X соответствует групповая средняя yi . Поместим в таблицу пары соответствующих значений переменной X и групповых средних переменной Y .

xi

Соответствующие

 

 

 

 

 

частоты nxi

групповые средние yi

 

x1

y

1

nx1

x2

y

2

nx2

xS

y

S

nxS

 

 

 

 

 

 

n

Далее в прямоугольной системе координат XOY строим точки

xi , yi i 1,2, s .

27

Теоретический анализ распределения, выраженного таблицей (стр.26), и дальнейшее расположения точек xi , yi на графике иногда даёт возможность установить вид функции yi f x , характеризующей форму связи между X и групповыми средними переменной Y .

Уравнение yi f x или yx f x называется уравнением регрес-

сии Y на X . Аналогично, если каждому значению yj переменной Y соот-

ветствует групповая средняя xj , то получим уравнение регрессии X на Y : xj y .

Итак, корреляционная зависимость задаётся уравнением регрессии.

Две основные задачи теории корреляции:

1)найти вид связи в виде уравнения;

2)установить силу (тесноту) связи между X,Y .

Наиболее распространённой формой корреляционной связи является линейная. Изучим виды такой связи.

Уравнение прямой регрессии Y на X имеет вид:

Y y yx x x ,

то есть прямая проходит через точки с координатами x, y . Это средняя точка корреляционного графика.

Здесь y x коэффициент регрессии Y на X , который равен:

 

 

 

 

 

 

 

 

S

r

 

 

yj

 

 

ni j

 

 

 

 

 

 

 

 

xi

 

x

 

y

 

 

 

y x

 

i 1

j 1

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

n x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

y x

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

S

r

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yj

 

 

 

ni j

 

 

 

S

 

 

 

 

 

 

 

 

 

xi

 

x

 

y

 

 

 

xi

 

x

2 nxi

где

i 1

j 1

 

 

 

 

 

 

 

 

 

,

x2

i 1

 

 

 

 

.

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

Уравнение прямой регрессии X на Y можно записать в виде

X x xy y y ,

коэффициент x y определяется равенством

S r

xi yjni j n x y

x y

 

i 1

j 1

,

 

r

y2j ny j n y2

j 1

или

 

 

 

 

 

 

 

 

 

 

28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

r

 

 

 

 

yj

 

 

ni j

 

 

 

 

 

 

 

 

xi

 

x

 

y

 

 

 

 

 

x y

 

i 1

j 1

 

 

 

 

 

 

 

,

 

 

 

 

 

n y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi

 

y

2

 

 

 

 

 

 

 

 

 

 

 

 

 

где y2

 

i 1

 

 

 

, тогда x y можно записать в виде

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y x

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

После выбора формы корреляционной связи, то есть определения вида функций yi f x или xj y , возникает проблема установления

тесноты связи, то есть оценка степени рассеяния одной переменной для разных значений другой. Для этого введём понятие коэффициента корреляции.

Коэффициентом корреляции переменных величин X и Y , связь между которыми задана корреляционной таблицей, называется среднее геометрическое их коэффициентов регрессии, имеющее знак последних.

r

y x x y ,

0, знак , если коэф-

причём выбирают знак (+), если y x 0 и x y

фициенты регрессии отрицательны.

Коэффициент корреляции является мерой тесноты линейной связи X и Y . Когда он равен нулю, X и Y не могут находиться в линейной корреляционной зависимости. Степень их линейной связанности растёт при приближении r к 1 . Если r 1, линейная связь является функциональной, знак r указывает на вид связи: прямая или обратная.

Оценка тесноты линейной связи (шкала Чаддока)

Значение

0-0,1

0,1-0,3

0,3-0,5

0,5-0,7

 

0,7-0,9

0,9-0,99

1

Теснота

Нет

Сла-

Уме-

Замет-

 

Высо-

Очень

Функ-

линейной

 

 

бая

ренная

ная

 

кая

высокая

ция зав.

связи

 

 

 

 

 

 

 

 

 

При r 0

связь прямая, то есть с ростом X растет Y .

 

При r 0

связь обратная, то есть с ростом X убывает Y .

 

Пример 2. В результате выборочных наблюдений получены соответ-

ственные значения переменных величин X

и Y для некоторых n объек-

тов.

 

 

 

 

 

 

 

 

 

а) Найти зависимость между величинами X и Y виде уравнений

29

регрессии.

б) Построить графически наблюдаемые выборочные значения признаков и прямую регрессию.

в) Оценить тесноту линейной связи между X и Y по данным выбор-

ки.

Запишем таблицу, беря в качестве представителя середину интервала.

X

Y

 

2,95

 

 

 

 

 

 

3,45

 

 

 

 

 

 

 

 

3,95

 

 

 

 

 

 

 

 

 

4,45

 

4,95

 

 

5,45

 

 

 

Итого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

2

 

 

 

8

 

 

2,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

8

 

 

3

 

 

 

12

 

 

3,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

13

 

1

 

 

 

 

 

 

 

16

 

 

4,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

27

 

 

4,7

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

16

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

21

 

 

5,3

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

5,9

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

Итого

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

28

 

 

 

 

 

 

 

 

 

 

37

 

15

 

 

5

 

 

 

100

1)

Вычисляем групповые средние:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

2,3;

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

4,95

 

 

 

 

 

 

5,45

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

1

 

 

 

4,95 6 5,45 2

5,075.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

x2

2,9;

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

4,45

 

 

 

 

 

 

4,95

 

 

 

 

 

 

5,45

;

 

 

 

 

 

y

2

 

 

 

 

4,45 1 4,95 8 5,45 3

 

5,03 3 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

x3

3,5;

 

 

y

 

 

 

 

 

 

 

3,95

 

 

 

4,45

 

 

 

 

 

 

 

 

4,95

;

 

 

 

 

 

 

y

3

 

3,95 2 4,45 13 4,95 1

4,42.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

13

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

 

 

 

 

 

 

 

 

 

x4

4,1;

 

 

y

 

 

 

 

 

 

 

3,45

 

 

 

 

3,95

 

 

 

 

 

 

 

 

4,45

;

 

 

 

 

 

y

4

 

 

 

3,45 1 3,95 6 4,45 20

4,3.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

1

 

 

 

 

 

 

6

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

27

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x5

4,7;

 

 

y

 

 

 

 

2,95

 

 

 

3,45

 

 

 

 

 

3,95

 

 

 

4,45

;

 

y

5

 

2,95 3,45 3,95 16 4,45 3

3,95.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

1

 

 

 

16

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

21

 

 

 

 

 

 

 

 

 

x6

5,3;

 

 

y

 

 

 

 

 

2,95

 

 

 

 

3,45

 

 

 

 

3,95

;

 

 

 

 

 

 

 

6

 

 

 

 

2,95 3 3,45 3 3,95 4

3,5.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

3

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

x7

5,9;

 

 

 

y

 

 

 

2,95

 

 

 

 

3,45

;

 

 

 

 

 

 

 

 

 

 

 

 

 

y

7

 

 

 

2,95 3 3,45 3

3,2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Точки xi ,

y

i

на рис.

 

 

3 будем обозначать " ".

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

1

2,95;

 

 

 

 

 

 

x

 

4,7

 

 

5,3

 

 

5,9

;

 

 

 

 

 

 

 

 

 

x

 

 

 

4,7 1 5,3 3 5,9 3

5,47.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nj

1

 

 

 

 

 

 

 

 

 

 

3

 

 

 

3

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

7