Статья: Корреляционный анализ

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

1.Для характеристики Y от Х построить следующие модели:

- линейную,

- степенную,

- показательную,

- гиперболическую.

2. Оценить каждую модель, определив:

- индекс корреляции,

- среднюю относительную ошибку,

- коэффициент детерминации,

- F-критерий Фишера.

3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.

4. рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 110% относительно среднего уровня.

5. Результаты расчетов отобразить на графике.

Таблица 1. Показатели качества зерна пшеницы

Решение:

1. Построение линейной модели парной корреляции.

Определим линейный коэффициент парной корреляции по следующей формуле:

По данным вычислениям видно, что связь между качествами пшеницы X и Y прямая и достаточно сильная.

Уравнение линейной регрессии имеет вид:

Уравнение линейной регрессии имеет вид:

С увеличением X, Y увеличивается. Это свидетельствует об прямой связи данных показателей.

Расчеты производились исходя из данных, указанных в таблице 2.

Таблица 2

Таблица 3

Рассчитаем коэффициент детерминации:

Вариация результата Y на 99,8% объясняется вариацией фактора Х.

Оценку значимости равнения регрессии проведем с помощь. F-критерия Фишера:

Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. . Определим среднюю относительную ошибку:

Данный показатель отражает на сколько в среднем расчетные значения для линейной модели отличаются от фактических значений (на 0,181%).

2.Построение степенной модели парной регрессии.

Уравнение степенной модели имеет вид: .

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

Таблица 4

Обозначим Y = lg , Х= lg x, А = lg a.

Тогда уравнение имеет вид: Y = A+bX - линейное уравнение регрессии.

Рассчитаем его параметры, используя таблицу 5.

Таблица 5

Уравнение регрессии будет иметь вид: Y = 0,708+0,945X.

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения и получим уравнение степенной модели регрессии.

Определим индекс корреляции:

Связь между показателем и фактором можно считать сильной.

Рассчитаем коэффициент детерминации:

Вариация результата Y на 99,8% объясняется вариацией фактора Х.

Рассчитаем F-критерий Фишера:

Средняя относительная ошибка:

В среднем расчетные значения для степенной модели отличаются от фактических значений на 0,028%.

Построение показательной функции.

Уравнение показательной кривой:

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

Получим линейное уравнение регрессии: .

Рассчитаем его параметры, используя данные таблицы 6.

Таблица 6

Уравнение будет иметь вид: Y = 1,515+0,0132x.

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:

Определим индекс корреляции:

Данный показатель характеризует среднюю связь между показателем и фактором.

Индекс детерминации:


Вариация результата Y на 66,6% объясняется вариацией фактора Х.

Рассчитаем F-критерий Фишера:

Средняя относительная ошибка:

В среднем расчетные значения для степенной модели отличаются от фактических значений на 0,078%.

2. Построение гиперболической функции.

Уравнение гиперболической функции: .

Произведем линеаризацию модели путем замены Х=1/х.

В результате получим линейное уравнение: .

Рассчитаем его параметры по данным таблицы 7.

Таблица 7

Таблица 8

Получим следующие уравнение гиперболической модели:

Определим индекс корреляции:

Исходя их данного показателя силу связи можно оценить средним уровнем.

Индекс детерминации:

То есть вариация результата Y на 24% объясняется вариацией фактора Х.

Рассчитаем F-критерий Фишера:

Средняя относительная ошибка:

В среднем расчетные значения у для гиперболической модели отличаются от фактических значений на 0,001%.

Для выбора лучшей модели построим сводную таблицу результатов:

Таблица 9

В качестве лучшей модели для построения прогноза можно взять линейную модель, так как она имеет большее значение F-критерия Фишера и коэффициента детерминации.

Расчет прогнозного значения результативного показателя:

Прогнозное значение результативного признака Y определим по уравнению линейной модели, подставив в него планируемую (заданную по условию) величину X.

По условию нужно рассчитать прогнозное значение результативного признака Y, если прогнозное значение фактора увеличится на 110% относительно среднего уровня. Средний уровень значения фактора X составляет 54,13.

При увеличении на 110% он составит 59,541:

Из этого уравнения следует, что при увеличении X на 110% относительно среднего уровня Y повысится в среднем до 239,9.

Фактический, расчетные и прогнозные значения по лучшей модели отобразим на графике:

График модели парной регрессии

корреляционный регрессия детерминация

Рис.1