Каппа = 0,63.
Рис. 2. Карта групп структур почвенного покрова, реализованная на основе линейной дискриминантной модели
Низкий процент совпадений наблюдается у группы полугидроморфно-эрозионных, что можно объяснить тесной связью с эрозионными группами и полугидроморфно-зональными, а также невысокой долей ее в обучающей выборке. Этот выбор связан с тем, что на исходной карте группы занимают территории со склонами, расчлененными ложбинной сетью, и с обобщением почвенных условий таких территорий. Поэтому выделялись только отдельные участки, приуроченные к отдельным элементам рельефа, а не к их сочетанию. Приличную корреляцию имеют слабо- и сильноэрозионные, полугидроморфно-зональные, полугидроморфные и пойменные группы ЭПС. Сравнительная оценка недостаточно формализована, но, учитывая неопределенности при составлении исходной карты, такой исход вполне удовлетворительный.
Таблица 4. Матрица совпадений исходной карты и карты, построенной на основе модели линейного дискриминантного анализа
|
Группы ЭПС площадь, га |
Группы ЭПС по исходной карте |
У |
Точность по строкам, % |
|||||||||||
|
З |
Э 1 |
Э 2 |
Э 3 |
ПЗ |
ПЭ |
ПГ 1 |
ПГ 2 |
Г |
А |
|||||
|
Группы ЭПС по цифровой карте |
З |
114.4 |
42.8 |
13.7 |
0 |
75.1 |
19.3 |
23.5 |
1.9 |
1.0 |
0 |
291.7 |
39 |
|
|
Э 1 |
49.5 |
358.4 |
152.5 |
2.3 |
89.4 |
61.5 |
70 |
22.9 |
28.9 |
9.1 |
844.5 |
42 |
||
|
Э 2 |
2 |
40.7 |
63.2 |
2 |
2.7 |
6.1 |
4.8 |
2.3 |
12.4 |
5 |
141.2 |
45 |
||
|
Э 3 |
0.7 |
9.3 |
18.8 |
5.8 |
0.2 |
0.2 |
2.5 |
0.1 |
5.3 |
4.4 |
47.3 |
12 |
||
|
ПЗ |
297.5 |
188.9 |
29.8 |
0 |
551.2 |
64.4 |
248 |
39.2 |
11.9 |
0.1 |
1431 |
39 |
||
|
ПЭ |
0.3 |
2.5 |
0.1 |
0 |
0.9 |
1.2 |
0.6 |
0.6 |
0.1 |
0.2 |
6.5 |
19 |
||
|
ПГ 1 |
49.4 |
65.5 |
13.5 |
0 |
273.1 |
46.9 |
510.1 |
125.6 |
62.7 |
21.1 |
1167.9 |
44 |
||
|
ПГ 2 |
2.2 |
3.2 |
0.6 |
0 |
6.2 |
5.2 |
23.8 |
38.9 |
12.9 |
13.0 |
106 |
37 |
||
|
Г |
1.6 |
13.2 |
8.9 |
1.4 |
5.3 |
3.9 |
7.3 |
9.0 |
60.2 |
18.0 |
128.8 |
47 |
||
|
А |
0.1 |
14.9 |
6.8 |
0.2 |
4.2 |
13.1 |
11.4 |
28.4 |
39 |
80.6 |
198.7 |
41 |
||
|
У |
517.7 |
739.4 |
307.9 |
11.7 |
1008.3 |
221.8 |
902 |
268.9 |
234.4 |
151.5 |
1784.04 |
Общая точность |
||
|
Точность по колонкам, % |
22 |
48 |
21 |
49 |
55 |
1 |
57 |
14 |
26 |
53 |
Общая точность |
41% |
Каппа = 0,28.
Учитывая сложность и многообразие почвенного покрова, формальные статистические подходы к оценке модели необходимо использовать в сочетании с экспертно-визуальной оценкой почвоведа. При экспертном анализе полученной карты можно сказать, что выделенные ареалы распространения групп ЭПС не лишены ландшафтной логики. Так, зональные (З) группы приурочены к выпуклым водоразделам и вершинам холмов, эрозионные структуры (Э 1, Э 2, Э 3) - к склонам различной крутизны, что связано с высокой ролью крутизны (SLP) в данной модели. Хорошо выделены пойменные участки (А), которые совпадают с долинами рек, протекающих на данной территории. Гидроморфные ЭПС заметно коррелируют с замкнутыми понижениями. Хорошо выделены полугидроморфно-зональные группы структур почвенного покрова, которые, ввиду специфики территории, представлены комбинациями автоморфных почв с некоторым участием слабоглееватых, и группа полугидроморфных глееватых, в которых доля глееватых почв возрастает, приуроченных к вогнутым поверхностям с небольшим уклоном и водосборным площадкам оврагов.
В целом карта имеет достаточно плавные переходы между разными группами структур почвенного покрова, а их общее распространение в целом не противоречит разработанной группировке структур почвенного покрова для Владимирского Ополья [15; c. 142-147].
Рассмотрим следующую модель на основе множественной логистической регрессии, разработанной в программном языке R 3.3.3 в оболочке RStudio c использованием пакета nnet.
Для построения модели использовался тот же набор параметров, что и для предыдущей дискриминантной модели, и стандартные настройки модели в пакете nnet.
По формальным признакам модель имеет хорошие показатели: общая точность 80%, а каппа 0,77 дает оценку существенного совпадения с исходными ключевыми ареалами групп ЭПС.
При сравнении же с исходной картой (табл. 5) оценка падает до общей корреляции в 34%, и каппа 0,22 дает удовлетворительное совпадение. При более высокой исходной точности, чем у линейного дискриминантного анализа, корреляция хуже, что, вероятно, свидетельствует о недостаточности этой модели.
Рассмотрим и проведем экспертную оценку визуализации модели множественной логистической регрессии в виде карты (рис. 3).
Полученная карта имеет более неоднородный рисунок распространения групп структур почвенного покрова. Большое распространение получила группа полугидроморфно-эрозионных. Эрозионные структуры имеют несколько другой характер распределения, но также приурочены к склонам: с увеличением крутизны увеличивается и вероятность более эрозионной группы. Пойменные группы смешаны и осложнены, в значительной степени, полугидроморфными глеевыми. Гидроморфные структуры схожи по распределению с картой на основе линейного дискриминантного анализа.
Таблица 5. Матрица корреляции исходной карты и карты, построенной на основе модели множественной логистической регрессии
|
Группы ЭПС площадь, га |
Группы ЭПС по исходной карте |
У |
Точность по строкам, % |
|||||||||||
|
З |
Э 1 |
Э 2 |
Э 3 |
ПЗ |
ПЭ |
ПГ 1 |
ПГ 2 |
Г |
А |
|||||
|
Группы ЭПС по цифровой карте |
З |
146.6 |
66.6 |
8.6 |
0 |
219.1 |
8.6 |
134.1 |
8.8 |
1.4 |
0 |
593.8 |
25 |
|
|
Э 1 |
59.8 |
226.7 |
85.5 |
2.9 |
67.6 |
20.6 |
34.3 |
3 |
6.2 |
0.2 |
506.8 |
45 |
||
|
Э 2 |
7.4 |
69.3 |
93.7 |
1.8 |
5.1 |
18.2 |
15.7 |
4.8 |
3.8 |
2.4 |
222.2 |
42 |
||
|
Э 3 |
0 |
7.9 |
15.9 |
3.8 |
0.1 |
1.2 |
2.1 |
0.2 |
4.6 |
6.9 |
42.7 |
9 |
||
|
ПЗ |
194.5 |
118.6 |
22.7 |
0 |
372.9 |
54.9 |
136.7 |
17.4 |
6.7 |
0.2 |
924.6 |
40 |
||
|
ПЭ |
24.2 |
173.2 |
51.7 |
1.6 |
99.6 |
63.6 |
83.2 |
38.7 |
17.1 |
21.1 |
574 |
11 |
||
|
ПГ 1 |
68.4 |
33.4 |
6.7 |
0 |
178 |
27.8 |
341.9 |
97 |
25.7 |
9.3 |
788.2 |
43 |
||
|
ПГ 2 |
8.2 |
18.8 |
4.0 |
0 |
40.6 |
11.1 |
102.1 |
36.2 |
39.4 |
6.9 |
267.3 |
14 |
||
|
Г |
4.1 |
13.9 |
3.6 |
0.1 |
12.3 |
9.8 |
34.6 |
27.2 |
101.9 |
28.8 |
236.3 |
43 |
||
|
А |
2.7 |
10.6 |
10.3 |
1.8 |
4.4 |
8.9 |
12.4 |
31.6 |
27.8 |
73.4 |
183.9 |
40 |
||
|
У |
515.9 |
739 |
302.7 |
12 |
999.7 |
224.7 |
897.1 |
264.9 |
234.6 |
149.2 |
1461 |
Общая точность |
||
|
Точность по колонкам, % |
28 |
31 |
31 |
32 |
37 |
28 |
38 |
14 |
43 |
49 |
Общая точность |
34% |
Каппа = 0,22.
Рис. 3. Карта групп структур почвенного покрова, реализованная на основе множественной логистической регрессионной модели
Общее впечатление от карты неудовлетворительное: группы излишне перемешаны между собой, и ряд их сложно интерпретировать при экспертной оценке почвоведа.
Дальнейшую сравнительную характеристику проведем после рассмотрения всех вариантов моделирования, использованных в данной работе.
Модель на основе метода "случайного леса" разрабатывалась в программном языке R 3.3.3 в оболочке RStudio c использованием пакета randomForest. Для построения модели использовался тот же набор параметров, что и для других моделей при ntree = 500, mtry = 5.
Стоит отметить, что отклик относительной важности параметров рельефа при построении случайных лесов решающих деревьев получился совершенно отличным от дискриминантного анализа (табл. 6). Крутизна получила не приоритетную значимость, а самой низкой отмечены замкнутые понижения.
Таблица 6. Относительная значимость параметров рельефа в модели "случайный лес"
|
Свойство рельефа |
Относительная важность |
|
|
Расстояние до гидрографической сети (VDCN), м |
380 |
|
|
Относительные превышения в области 500 м (TPI0500) |
338 |
|
|
Топографический индекс влажности (TWI) |
314 |
|
|
Крутизна (SLP), грд. |
277 |
|
|
Относительные превышения в области 1000 м (TPI1000) |
206 |
|
|
Фактор длины/крутизны (LSF) |
184 |
|
|
Глубина понижений (VD), м |
178 |
|
|
Относительные превышения в области 100 м (TPI0100) |
157 |
|
|
Относительные превышения в области 250 м (TPI0250) |
133 |
|
|
Замкнутые понижения (CD) |
32 |
Алгоритм "случайных лесов" достаточно сложен, но дает высокие оценки точности. Случайный лес решающих деревьев позволяет построить модель со 100%-ным исходом, имеет коэффициент каппа 1,0. Такой подход к построению модели, при сравнении с исходной картой, показывает достаточно невысокую состоятельность и резкое снижение формальных оценок точности. Общее совпадение 28%, а каппа в 0,15 дает отклик слабого совпадения.
Рассмотрим полученную карту групп структур почвенного покрова на основе модели "случайного леса" и проведём экспертную оценку (табл. 7).
Таблица 7. Матрица совпадений исходной карты и карты, построенной на основе модели "случайный лес"
|
Группы ЭПС площадь, га |
Группы ЭПС по исходной карте |
У |
Точность по строкам, % |
|||||||||||
|
З |
Э 1 |
Э 2 |
Э 3 |
ПЗ |
ПЭ |
ПГ 1 |
ПГ 2 |
Г |
А |
|||||
|
Группы ЭПС по цифровой карте |
З |
139.7 |
69.4 |
28.6 |
0.2 |
197.8 |
37.3 |
39.2 |
3.8 |
1.6 |
0.1 |
517.7 |
27 |
|
|
Э 1 |
93.2 |
260 |
131.4 |
2.4 |
268.1 |
108.5 |
255.4 |
83.2 |
27.2 |
9.2 |
1238.6 |
21 |
||
|
Э 2 |
10.1 |
89.2 |
30.1 |
0.8 |
22.8 |
10.0 |
13.9 |
4.8 |
7 |
2.5 |
191.2 |
16 |
||
|
Э 3 |
0.5 |
11.6 |
18.1 |
4.0 |
0 |
0.2 |
3.8 |
0 |
0.1 |
0.4 |
38.7 |
10 |
||
|
ПЗ |
182.3 |
166.1 |
48.9 |
0 |
277.2 |
8.7 |
109.1 |
9.3 |
5.4 |
0 |
807 |
34 |
||
|
ПЭ |
0 |
0.8 |
0.6 |
0 |
0 |
1.4 |
1.7 |
0 |
0.3 |
0.1 |
4.9 |
29 |
||
|
ПГ 1 |
69.9 |
96.2 |
28.2 |
0.2 |
156.9 |
24.0 |
183 |
38.9 |
21.3 |
0.1 |
618.7 |
30 |
||
|
ПГ 2 |
11.2 |
3.4 |
0.6 |
0 |
31.5 |
0.3 |
142.1 |
36.9 |
2.9 |
0 |
228.9 |
16 |
||
|
Г |
6.9 |
23.7 |
8.3 |
0.2 |
40 |
22.5 |
120.7 |
66.5 |
143.7 |
14.7 |
447.2 |
32 |
||
|
А |
1.5 |
18.4 |
7.9 |
4.1 |
5.3 |
11.9 |
28.0 |
21.2 |
25.28 |
122.2 |
245.78 |
50 |
||
|
У |
515.3 |
738.8 |
302.7 |
11.9 |
999.6 |
224.8 |
896.9 |
264.6 |
234.78 |
149.3 |
1199 |
Общая точность |
||
|
Точность по колонкам, % |
27 |
35 |
10 |
34 |
28 |
1 |
20 |
14 |
61 |
82 |
Общая точность |
28% |