1.Для характеристики Y от Х построить следующие модели:
- линейную,
- степенную,
- показательную,
- гиперболическую.
2. Оценить каждую модель, определив:
- индекс корреляции,
- среднюю относительную ошибку,
- коэффициент детерминации,
- F-критерий Фишера.
3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4. рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 110% относительно среднего уровня.
5. Результаты расчетов отобразить на графике.
Таблица 1. Показатели качества зерна пшеницы
Решение:
1. Построение линейной модели парной корреляции.
Определим линейный коэффициент парной корреляции по следующей формуле:
По данным вычислениям видно, что связь между качествами пшеницы X и Y прямая и достаточно сильная.
Уравнение линейной регрессии имеет вид:
Уравнение линейной регрессии имеет вид:
С увеличением X, Y увеличивается. Это свидетельствует об прямой связи данных показателей.
Расчеты производились исходя из данных, указанных в таблице 2.
Таблица 2
Таблица 3
Рассчитаем коэффициент детерминации:
Вариация результата Y на 99,8% объясняется вариацией фактора Х.
Оценку значимости равнения регрессии проведем с помощь. F-критерия Фишера:
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. . Определим среднюю относительную ошибку:
Данный показатель отражает на сколько в среднем расчетные значения для линейной модели отличаются от фактических значений (на 0,181%).
2.Построение степенной модели парной регрессии.
Уравнение степенной модели имеет вид: .
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
Таблица 4
Обозначим Y = lg , Х= lg x, А = lg a.
Тогда уравнение имеет вид: Y = A+bX - линейное уравнение регрессии.
Рассчитаем его параметры, используя таблицу 5.
Таблица 5
Уравнение регрессии будет иметь вид: Y = 0,708+0,945X.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения и получим уравнение степенной модели регрессии.
Определим индекс корреляции:
Связь между показателем и фактором можно считать сильной.
Рассчитаем коэффициент детерминации:
Вариация результата Y на 99,8% объясняется вариацией фактора Х.
Рассчитаем F-критерий Фишера:
Средняя относительная ошибка:
В среднем расчетные значения для степенной модели отличаются от фактических значений на 0,028%.
Построение показательной функции.
Уравнение показательной кривой:
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
Получим линейное уравнение регрессии: .
Рассчитаем его параметры, используя данные таблицы 6.
Таблица 6
Уравнение будет иметь вид: Y = 1,515+0,0132x.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
Определим индекс корреляции:
Данный показатель характеризует среднюю связь между показателем и фактором.
Индекс детерминации:
Вариация результата Y на 66,6% объясняется вариацией фактора Х.
Рассчитаем F-критерий Фишера:
Средняя относительная ошибка:
В среднем расчетные значения для степенной модели отличаются от фактических значений на 0,078%.
2. Построение гиперболической функции.
Уравнение гиперболической функции: .
Произведем линеаризацию модели путем замены Х=1/х.
В результате получим линейное уравнение: .
Рассчитаем его параметры по данным таблицы 7.
Таблица 7
Таблица 8
Получим следующие уравнение гиперболической модели:
Определим индекс корреляции:
Исходя их данного показателя силу связи можно оценить средним уровнем.
Индекс детерминации:
То есть вариация результата Y на 24% объясняется вариацией фактора Х.
Рассчитаем F-критерий Фишера:
Средняя относительная ошибка:
В среднем расчетные значения у для гиперболической модели отличаются от фактических значений на 0,001%.
Для выбора лучшей модели построим сводную таблицу результатов:
Таблица 9
В качестве лучшей модели для построения прогноза можно взять линейную модель, так как она имеет большее значение F-критерия Фишера и коэффициента детерминации.
Расчет прогнозного значения результативного показателя:
Прогнозное значение результативного признака Y определим по уравнению линейной модели, подставив в него планируемую (заданную по условию) величину X.
По условию нужно рассчитать прогнозное значение результативного признака Y, если прогнозное значение фактора увеличится на 110% относительно среднего уровня. Средний уровень значения фактора X составляет 54,13.
При увеличении на 110% он составит 59,541:
Из этого уравнения следует, что при увеличении X на 110% относительно среднего уровня Y повысится в среднем до 239,9.
Фактический, расчетные и прогнозные значения по лучшей модели отобразим на графике:
График модели парной регрессии
корреляционный регрессия детерминация
Рис.1