|
Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» НОЯБРЬ 2017 |
|
|
ТЕХНИЧЕСКИЕ НАУКИ |
|
Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» НОЯБРЬ 2017 |
|
|
ТЕХНИЧЕСКИЕ НАУКИ |
Тверской государственный технический университет
Математическая обработка статистических данных при пассивном эксперименте
Федоров Б.А., Чувирина И.В.,
Шикунова О.Б.
Аннотации
Рассмотрены варианты статистической обработки материалов пассивного эксперимента методом классического многомерного регрессионного анализа и регрессии по методу главных компонент. Регрессионные модели по методу главных компонент позволяют учитывать, как все параметры, так и эффект их взаимодействия. Приведены зависимости общего модуля деформации торфяной залежи от ряда ее параметров. Применение регрессионного анализа на главных компонентах позволяет выбрать основной показатель при постоянстве его воздействия на параметр функции, а также с большей достоверностью получать регрессионные модели по его оценке в природных условиях.
Ключевые слова: пассивный эксперимент, метод главных компонент, торфяная залежь.
The versions of the statistical processing of the materials of passive experiment by the method of classical multidimensional regression analysis and regression according to the method of main components are examined. Regression models according to the method of main components make it possible to consider both the all parameters and effect of their interaction. The dependences of the common modulus of deformation of the peat deposit on a number of its parameters are given. The application of regression analysis on the main components makes it possible to select basic index with the constancy of its action on the parameter of function, and with the larger authenticity to also obtain regression models according to its estimation under the natural conditions.
Keywords: passive experiment, the method of main components, the peat deposit.
Основное содержание исследования
Экспериментальные данные, полученные при научных исследованиях в различных отраслях деятельности, подвергаются статистическому анализу, состоящему из комплекса математических исследований. В результате получают регрессионно-корреляционные модели для оценки результирующего фактора от одного или нескольких признаков. Исследования естественных природных систем соответствует условиям проведения пассивного эксперимента. Регрессионные зависимости применяют для оценки физико-механических свойств торфяных залежей для проектирования насыпей промышленных дорог на слабом основании [9, 10]. Обычно статистические модели получают на основе метода классического линейного регрессионного анализа.
Целью данной статьи является обоснование применения метода главных компонент при статистическом анализе материалов пассивного эксперимента на основе анализа регрессионных зависимостей.
Прогнозирование свойств по этим регрессионным моделям может в ряде случаев осуществляться со значительными погрешностями. Подобное явление возникает из-за смещения в оценках коэффициентов регрессии в следствии мультиколлинеарности, т.е. сильной коррелированности исходных параметров [1]. Кроме того, классический регрессионный анализ основан на предположении нормальности распределений исходных параметров, что не всегда удается соблюсти. Замена исходных взаимосвязанных переменных на некоторую совокупность некоррелированных параметров (компонент) при сохранении без искажения всей информации о свойствах изучаемого торфяного основания может быть осуществлена методом главных компонент. Метод главных компонент для статистического анализа применяют при исследованиях в различных сферах деятельности: социально-экономические исследования [3], управление предприятием на основе анализе его производственно-хозяйственной деятельности [12], при инженерногеологических изысканиях для оценки прочностных и деформационных свойств слабых грунтов [2, 4, 7, 9], инженерной геологии [6], технологических процессов производства [8] и др. У регрессионной модели, построенной по главным компонентам, будут отсутствовать отмеченные выше недостатки.
Теоретические основы метода главных компонент, а также алгоритмы их вычисления приведены в специальной литературе по математической статистике [1, 3, 11 и др.].
Рассмотрим варианты построения многофакторных зависимостей обоими способами.
Для торфяных систем Ивкина Т.Н., Королев А.С. [3] оценивали влияние на предельное сопротивление сдвигу по крыльчатке ?е пятимерного вектора строки Х = [H, R, W0, pH, D].
Прочность торфа tе определялась крыльчаткой СК-8 с пятикратной повторностью на глубине Н. По образцам торфа, отобранным с этой же глубины, определялись по стандартным методикам с двукратной повторностью физико-химические показатели (R - степень разложения, %; W0 - абсолютная влажность, %; pH - кислотность; D - содержание фракций <250mk). Всего наблюдений - 152.
По результатам классического линейного многофакторного анализа в соответствии с критерием достоверности коэффициентов множественной линейной регрессии только R и W0 оказывают достоверное влияние на ?е. Влияние остальных параметров не достоверно. Обработка данных методом главных компонент показала, что генеральной компоненты нет. Все компоненты носят общий групповой характер. Максимальную нагрузку на 1 и 5 компоненты дают показатели R и W0, на вторую и четвертую - pH, D, на третью - глубина Н. Достоверное влияние на прочность в соответствии с критериями достоверности оказывают первая, вторая, четвертая и пятая компоненты. Устойчивое влияние на показатель прочности оказывает только абсолютная влажность W0, через все компоненты, уменьшая ?е. Остальные показатели оказывают двойственное влияние на ?е, через одни компоненты увеличивая его, а через другие уменьшают.
Таким образом, все показатели вектор строки влияют на результирующий параметр tе.
Оценка деформационных свойств торфяных залежей по результатам натурных обследований насыпей дорог на болотах осуществлялась через обобщенный модуль деформации Е*= Еоб / (1 - m2) (Еоб - модуль общей деформации; m - коэффициент поперечного расширения) [5]. Для многомерного анализа Е* (кПа) неосушенных залежей [7, 9] использовалась вектор-строка параметров Х = [P, H, a/H, W0, R]. При обследовании определялись параметры: P - удельная нагрузка от тела насыпи (кПа); Н - глубина болота (м); 2а - расчетная ширина равномерно распределенной нагрузки (м); Wo - естественное влагосодержание (г/г); R - степень разложения (%). Количество поперечников дорог неосушенных торфяных залежей - 137.
Результаты статистических расчетов классического многомерного регрессионного анализа для всех факторов приведены в таблице 1.
Проверка на значимость коэффициентов регрессии при параметрах Р, W0, R дает положительный результат., что подтверждает результаты, полученные по парным зависимостям. В многомерном регрессионном уравнении недостоверным оказалось влияние на Е* параметров Н и а/Н, характеризующих геометрию насыпи и залежи. Попеременное исключение из анализа Н или а/Н и построение регрессионных уравнений вида Е*= f (P, H, Wo, R) и Е*=f (P, а/H, Wo, R) для неосушенной залежи привело к зависимостям со значимыми коэффициентами регрессии вида
Е*= 46,69 + 1,149 Р + 4,82 Н - 3,97 Wo + 0,953 R ± t 27,4; Rмн=0,829;
Е*= 54,63 + 1,342 Р - 3,534 а/Н - 3,97 Wo + 1,06 R ± t 27,6; Rмн=0,826;
Е*= 39,23 + 1,259 Р - 3,08 Wo + 1,236 R ± t 27,59; Rмн=0,825,
где t - нормирующий множитель.
Таблица 1. Результаты анализа множественных уравнений регрессии обобщенного модуля общей деформации Е*
|
Пара метр |
Коэффициенты корреляции |
Коэффици ент уравнения вi |
Ср. кв. отклон. коэфф. sвi |
Критерий Стьюдента достоверно сти tВi |
Cвободный член во, кПа |
Коэфф. множ. коррел. Rмн |
||
|
Парный r |
Частный r |
|||||||
|
остат. ср. квадрат. отклон. ?остE* |
||||||||
|
ср. квадр. от клон. ?Rмн |
||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
|
Неосушенная торфяная залежь (137 поперечников) 1) Е*=f (P, H, а/Н, Wo, R), кПа |
||||||||
|
P, кПа |
+0,745 |
+0,600 |
1, 202 |
0,137 |
8,79 |
53,23 |
0,829 |
|
|
Н, м |
+0,455 |
+0,128 |
3,80 |
2,51 |
1,52 |
|||
|
а/Н |
+0, 195 |
-0,049 |
-1,24 |
2,15 |
0,58 |
|||
|
27,47 |
0,027 |
|||||||
|
Wo, г/г |
-0,362 |
-0,241 |
-3,97 |
1,37 |
2,91 |
|||
|
R, % |
+0,508 |
+0,264 |
0,972 |
0,04 |
3,20 |
|||
|
2) Е*=f (P, H, Wo, R, Р• (а/Н), Р•Wo, P•R), кПа |
||||||||
|
P, кПа |
+0,745 |
+0, 203 |
1,747 |
0,721 |
2,42 |
17,7 |
0,833 |
|
|
Н, м |
+0,455 |
+0,115 |
3,343 |
2,458 |
1,36 |
|||
|
Wo, г/г |
-0,362 |
-0,040 |
-2,256 |
4,848 |
0,47 |
|||
|
R, % |
+0,508 |
+0,141 |
1,604 |
0,962 |
1,67 |
|||
|
27,4 |
0,027 |
|||||||
|
Р• (а/Н) |
+0,389 |
-0,116 |
-0,041 |
0,030 |
1,37 |
|||
|
Р•Wo |
+0,400 |
-0,030 |
-0,024 |
0,067 |
0,35 |
|||
|
P•R |
+0,775 |
-0,056 |
-0,009 |
0,013 |
0,66 |
Примечание. Стандартное значение критерия Стьюдента равно 1,96.
В качестве начального материала для вычисления главных компонент используют корреляционную матрицу исходных параметров, над которой выполняют методами линейной алгебры ортогональные преобразования. В начале из нее выделяют главные компоненты, которые являются характеристическими (собственными) векторами этой матрицы. Каждому характеристическому вектору соответствует собственное число, наибольшее из которых является дисперсией первой главной компоненты. Первые три компоненты объясняют 89,6 процентов общей дисперсии параметров выборки. При этом первая главная компонента связана практически со всеми параметрами выборок и может быть признана генеральной, а остальные относятся к общим групповым. Вторую компоненту образовывают параметры геометрии - Н, а/ H, а третью компоненту у всех выборок - внешняя нагрузка P.
Дисперсии главных компонент соответствующие их собственным числам в порядке убывания, а также матрица коэффициентов корреляции параметров с ними приведены в таблице 2.
Для образования главных компонент используются параметры, которые вносят в компоненты достоверный вклад.
Таблица 2. Матрица коэффициентов корреляции с главными компонентами
|
Подтип, степень осуше ния залежи |
Компоненты |
Дисперсии компонент, % |
Параметры залежи |
|||||
|
P |
H |
a/H |
W0 |
R |
||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
|
Неосушен ная торфяная залежь |
КI |
38,2 |
+0,662 |
+0,403 |
+0,293 |
-0,702 |
+0,836 |
|
|
КII |
28,9 |
-0,085 |
-0,852 |
+0,812 |
-0, 196 |
+0,028 |
||
|
КIII |
22,5 |
+0,699 |
+0,213 |
+0,444 |
+0,561 |
-0,341 |
||
|
КIV |
6,9 |
-0,112 |
-0,039 |
+0,027 |
+0,393 |
+0,428 |
||
|
КV |
3,5 |
+0,233 |
-0,254 |
-0,239 |
+0,018 |
+0,037 |
При диагонализации матрицы коэффициентов корреляции между параметрами получают матрицу, составленную из коэффициентов корреляции между нормализованными параметрами и главными компонентами, которые называются весами параметров в компонентах.
Для использования главных компонент в регрессионном анализе перейдём от нормализованных параметров к центрированным параметрам, матрица весов (нагрузка) которых в главных компонентах приведена в таблице 3. Величина главной компоненты K r (r = 1…n) представляет собой сумму произведений центрированных значений параметров основания и весов (нагрузок) этих параметров Аir (см. табл.3) на вычисляемую компоненту и равна
n
K r = е Air (Хi - Х0i), r=1
где Хi, Х0i - соответственно, исходный параметр и его среднеарифметическое значение (например - Р).
Таблица 3. Матрица весов параметров в главных компонентах
|
Степень осушения залежи |
Параметр |
Веса параметров в компонентах, Аir |
||||||
|
Обозна- чение, Xi |
Cреднее значение X0i |
КI |
КII |
КIII |
КIV |
КV |
||
|
Неосушенная залежь |
P, kПа |
64,2 |
+1,885 |
0 |
+2,53 |
0 |
+2,157 |
|
|
H, м |
2,86 |
+20,3 |
-49,1 |
+13,6 |
0 |
-41,6 |
||
|
a/H, - |
2,84 |
+13,2 |
+41,7 |
+25,3 |
0 |
-34,9 |
||
|
W0, % |
728 |
-0,237 |
-0,076 |
+0,241 |
+0,306 |
0 |
||
|
R, % |
29,1 |
+6,0 |
0 |
-2,76 |
+0,71 |
0 |
Регрессионное уравнение по главным компонентам обобщенного модуля общей деформации Е* (кПа) со значимыми коэффициентами регрессии при компонентах для вектор строки Х = [P, H, a/H, W0, R] имеет вид [9]
Е* - 131 = 0,154 KI + 0,126 KI I + 0,265 KI I I - 0,058 KV + t 27,5.
Анализируя влияние параметров через главные компоненты на деформационную характеристику Е* можно отметить следующее. Все параметры достоверно влияют на Е*. Внешняя нагрузка и глубина болота через все значимые компоненты увеличивают Е*, что совпадает с выводами по анализу парных зависимостей. Остальные показатели оказывают двойственное влияние, через одни компоненты, уменьшая их, а через другие увеличивая.