Статья: Использование многомерных статистических методов для фонетической классификации видов яблони (Malus Mill)

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Таблица 4. Характеристика видов яблони по признакам (ранги)

Кластерный анализ видов. Главное назначение кластерного анализа - разделение множества исследуемых объектов на однородные группы (кластеры).

Кластеризацию проводили на основе вычислений евклидовых расстояний между видами по комплексу 25 признаков. После получения матрицы евклидовых расстояний проводили иерархическую (древовидную) процедуру, приводящую к построению дендрограммы. При этом использовали правило полной связи, которое означает следующее: расстояние между двумя объектами (видами), входящими в кластер, не должно превышать некоторого порогового значения «d»; таким образом, «d» определяет максимально допустимый диаметр подмножества, образующего кластер.

На рис. 1 представлена дендрограмма видов яблони, полученная по правилу полной связи.

Рис. 1. Дендрограмма 31 вида яблони по комплексу 25 признаков

Из дендрограммы видно, что, если максимально допустимым расстоянием объединения (диаметром подмножеств, кластеров) принять 60, то данная совокупность видов разобьется на 4 кластера (I, II, III, IV).

В кластер I вошли 5 видов (диаметр объединения подмножества около 55), относящиеся к трем разным секциям: Sorbomalus (M.yunnanensis, M.sargentii), Eriolobus (M.trilobata), Docyniopsis (M.sikkimensis) и Gymnomeles (M.mandshurica). Все виды имеют китайское происхождение. Яблоня маньжурская наиболее удалена от центра кластера. В пределах этого кластера выделяются следующие пары наиболее сходных видов: яблоня юньнаньская - яблоня сиккимская (подкластер А, диаметр объединения 43); яблоня трехлопастная - яблоня Саржента (подкластер В, диаметр объединения 42). В целом морфологическое сходство видов не связано с принадлежностью к той или иной секции. В кластер II вошли 6 видов (диаметр объединения подмножества около 58), все они относятся к секции Sorbomalus, причем M.transitoria, M.toringoides и M.kansuensis - к одной серии - ганьсуйские яблони, а M.prattii и M.honanensis - к другой серии данной секции - юньнаньские яблони. Все вошедшие виды - китайские. Наиболее сходными группами видов были: яблоня торинговидная - яблоня ганьсуйская (подкластер С, диаметр объединения 34), яблоня Пратта - яблоня хэнаньская - яблоня фуска (подкластер D, диаметр объединения 45). Яблоня переходная сильно удалена от центра данного кластера. Таким образом, между морфологическим сходством этих видов и принадлежностью к секции и сериям установлена тесная связь.

В кластер III вошли 10 видов (диаметр объединения подмножества около 56), 6 из них - гибридного происхождения (примечательно, что все гибридогенные виды яблони вошли в один кластер): M.x micromalus, M.x floribunda, M.x sieboldii, M.x zumi, M. x prunifolia, M. x spectabilis и 4 - относящиеся к секции Gymnomeles: M.halliana, M.baccata, M. himalaica, M.hupehensis. Гибридогенные виды объединяет тот факт, что все они возникли с участием M.baccata. Все виды имеют восточно- и центральноазиатское происхождение. В данном кластере имеются отчетливые сгущения видов. Установлены следующие сходные группы видов: яблоня микрояблоня - яблоня обильноцветущая (подкластер Е, диаметр объединения 35); яблоня Цуми - яблоня Холла - яблоня Зибольда (подкластер F, диаметр объединения 38); яблоня замечательная - яблоня сливолистная (подкластер G, диаметр объединения 36); яблоня гималайская - яблоня хубейская - яблоня ягодная (подкластер H, диаметр объединения 45). В целом связь между морфологическим сходством и таксономическими статусами данных видов достаточно очевидна.

В кластер IV вошли 10 видов (диаметр объединения подмножества около 58). В данный кластер вошли все 4 вида, относящиеся к секции Malus: M.orientalis, M.sieversii, M.asiatica, M.sylvestris; а также все 3 североамериканские вида, относящиеся к секции Choromeles: M.ioensis, M.coronaria. M.angustifolia; 1 вид секции Sorbomalus: M.toringo; 2 вида секции Docyniopsis: M.laoensis, M.tschonoskii. Географическое происхождение видов, вошедших в данный кластер, достаточно разнообразное: 3 китайско-японских вида (торинго, азиатская, чоносски), 1 - среднеазиатский (Сиверса), 1 - североевропейский (лесная); 1 - кавказский (восточная) и 3 - североамериканских (айовская, венечная, узколистная). В пределах данного кластера также четко выделяются сгущения разных видов: яблоня восточная - яблоня айовская - яблоня Сиверса - яблоня азиатская (подкластер J, диаметр объединения 39); яблоня чоносски - яблоня лесная (подкластер K, диаметр объединения 45); яблоня венечная - яблоня узколистная, эти два вида принадлежат к одной серии - венечные яблони (подкластер L, диаметр объединения 48). Трудно объяснимым является тесное сходство яблони восточной и яблони айовской, имеющие разные ареалы и, вероятно, генетическое происхождение. Яблони торинго и лаосская сильно удалены от центра кластера. В целом данный кластер отличается большим по сравнению с другими кластерами диаметром объединения. Таким образом, по большинству видов, вошедших в данных кластер, установлена связь между теснотой сходства и принадлежностью к определенным секция и сериям.

В целом по результатам кластерного анализа можно сделать следующие выводы: 1) в большинстве случаев в кластер попадают виды, имеющие одинаковую принадлежность к секциям и сериям, то есть система рода Malus, предложенная В.Т.Лангельфельдом, достаточно обоснована степенью сходства между видами по комплексу диагностических признаков; 2) кластерный анализ гибридогенных видов позволяет в ряде случаев установить их геномный состав (на примере с M.baccata); 3) в ряде случаев возникают группы сходных по морфологическим признакам видов, трудно объяснимые с точки зрения центров происхождения, экологии и генетики.

Сокращение числа признаков. При исследовании часто возникает необходимость уменьшения числа переменных (признаков) без потери информации. Речь идет о выделении наиболее информативных признаков и редукции наименее информативных. Сокращение числа признаков можно осуществлять несколькими способами: 1) используя кластерный анализ, но вместо кластеризации объектов необходимо кластеризировать признаки и выбирать в пределах кластеров один или несколько наиболее информативных переменных, наименее коррелирующих между собой; 2) на основе факторного анализа - сокращение достигается путем выделения скрытых общих факторов, объясняющих связи между наблюдаемыми признаками объектов, поэтому вместо исходного набора переменных имеется возможность анализировать данные по выделенным факторам; 3) на основе метода главных компонент - позволяет вычленить главные и некореллирующие переменные. Ниже приведен пример сокращения числа переменных на основе использования кластерного анализа. Для той же матрицы исходных данных провели кластеризацию признаков для выделения из них наиболее информативных. На рис. 2 приведена дендрограмма 25 признаков яблони, построенная на основе изменчивости 31 вида по методу полной связи.

Рис. 2. Дендрограмма 25 признаков 31 вида яблони

Выбираем максимально допустимый диаметр объединения 65. В этом случае переменные разделятся на 4 кластера.

В кластер I вошли 6 признаков (диаметр объединения подмножества 64): 2 признака длины черешка (абсолютной и относительной), 2 признака формы листовой пластинки (степени овальности и яйцевидности), 1 признак наличия или отсутствия лопастей на листовой пластинке, 1 признак числа цветков в соцветии. Это означает, что эти признаки в определенной степени сопряжены между собой. Среди них необходимо выбрать те, которые, с одной стороны, обладают узкой нормой реакции на условия среды, с другой стороны, легче диагностируются и вместе с этим слабо коррелируют друг с другом. С этих позиций выбираем 4 признака: относительная длина черешка; степени овальности и яйцевидности листовой пластинки, среднее число цветков в соцветии.

В кластер II вошли 5 признаков (диаметр объединения подмножества 61): окраска кожицы плода, длина цветоножки, форма основания листа, форма плода, окраска венчика. Исходя из близости расстояний для объединения, выбираем 3 следующих признаки: длину цветоножки, форму основания листа, окраску венчика.

В кластер III вошли 4 признака (диаметр объединения подмножества 60): индекс формы листа (овальности), ширина и длина листовой пластинки, диаметр венчика. Исходя из того, что эти 4 признака образуют 2 сгущения, выбираем 2 признака: индекс формы листа и диаметр венчика.

В кластер IV вошли 10 признаков (диаметр объединения подмножества 62): опушение цветоножки, опушение гипантия, опушение столбика пестика, тип зазубренности края листа, тип соцветия, опушение верхней и нижней стороны листовой пластинки, диаметр плода, опадаемость чашелистиков, жизненная форма. Исходя из количества сгущений, выбираем в качестве информативных 6 следующих признаков: опушение цветоножки, опушение столбика, тип зазубренности края листа, опушение верхней стороны листа, опадаемость чашелистиков, жизненная форма.

Таким образом, выделено 15 информативных признаков из 25: признаки соцветия и цветка:

1) среднее число цветков в соцветии; 2) средняя длина цветоножки; 3) окраска венчика; 4) диаметр венчика; 5) опушение цветоножки; 6) опушение столбика;

признаки листа:

7) форма основания листа; 8) индекс формы листа: 9) тип зазубренности края листа; 10) опушение верхней стороны листа; 11) относительная длина черешка; 12) степень овальности листа; 13) степень яйцевидности листа; признаки плода:

14) опадаемость чашелистиков; общие признаки:

15) жизненная форма. Эти признаки рекомендуется использовать для таксономического анализа видов яблони.

Таксономический анализ видов по Е.С.Смирнову. Таксономический анализ по методике Е.С.Смирнова [14] отличается от кластерного анализа тем, что оперирует с качественными признаками, выраженными в номинальной шкале, а также тем, что для каждой модальности признака (состояния качественного переменного) вычисляются веса по ее присутствию и отсутствию. Вес модальности обратно пропорционален частоте ее встречаемости в выборке, то есть редким модальностям присваиваются большие веса, часто встречающимся - малые. При сравнении объектов вычисляется средняя сумма весов по всем сравниваемым модальностям: при совпадении по наличию модальностей плюсуется вес по ее присутствию, при совпадении по отсутствию модальностей плюсуется вес по ее отсутствию, при любом несовпадении отнимается единица.

При использовании данного метода появляется возможность оценить степень оригинальности каждого объекта совокупности. По каждому объекту можно вычислить среднюю сумму весов всех его модальностей как по их присутствию, так и отсутствию. Эта сумма и представляет собой коэффициент оригинальности объекта. Коэффициент оригинальности будет тем выше, чем более редкие модальности составляют морфотип объекта.

В таблице 5 приведены коэффициенты оригинальности изученных видов яблони.

Таблица 5. Коэффициенты оригинальности видов яблони

Название вида

Коэффициент оригинальности

Malus toringoides

1,458

Malus transitoria

1,402

Malus mandshurica

1,366

Malus ioensis

1,344

Malus trilobata

1,342

Malus kansuensis

1,185

Malus tschonoskii

1,162

Malus halliana

1,142

Malus sikkimensis

1,075

Malus fusca

1,064

Malus prattii

1,000

Malus himalaica

0,981

Malus coronaria

0,972

Malus angustifolia

0,947

Malus honanensis

0,946

Malus x micromalus

0,939

Malus baccata

0,925

Malus sylvestris

0,908

Malus toringo

0,870

Malus orientalis

0,862

Malus sargentii

0,853

Malus yunannensis

0,850

Malus asiatica

0,846

Malus x spectabilis

0,845

Malus x floribunda

0,843

Malus x prunifolia

0,836

Malus x zumi

0,827

Malus sieversii

0,826

Malus sieboldii

0,809

Malus hupehensis

0,803

Malus laosensis

0,774

Из таблицы 5 следует, что наиболее оригинальными по сочетанию признаков видами яблони (морфотипы которых составлены из наиболее редко встречающихся модальностей признаков) являются: Malus toringoides, Malus transitoria, Malus mandshurica, Malus ioensis, Malus trilobata. Наименее оригинальными (банальными) являются следующие виды (их морфотипы составлены из часто встречающихся модальностей признаков): Malus ionensis, Malus hupehensis, Malus sieboldii, Malus sieversii, Malus x zumi.

После вычисления всех коэффициентов сходства формируется матрица коэффициентов сходства. Для кластеризации объектов использовали неиерархическую кластер-процедуру - метод максимального корреляционного пути Выханду [15], в результате чего был построен дендрит максимальных коэффициентов сходства. Разрезание дендрита на кластеры проводили по методике С.Р.Вельдре [16]. Общая структура дендрита и результаты кластеризации представлены на рис. 3.

Итак, было выделено 6 кластеров, 3 из которых включали большое число видов и 3 - одиночные виды. Состав кластеров был следующим (номера в дендрите совпадают с номерами видов в табл. 3-4).

В кластер 1 вошли 6 видов: Malus fusca, Malus honanensis, Malus sikkimensis, Malus tschonoskii, Malus x prunifolia, Malus x spectabilis. Уровень тесноты сходства в пределах данного кластера примерно одинаковый: от 0,32 до 0,38.

В кластер 2 вошли 14 видов: Malus baccata, Malus halliana, Malus himalaica, Malus hupehensis, Malus kansuensis, Malus prattii, Malus sargentii, Malus sieboldii, Malus toringoides, Malus transitoria, Malus trilobata, Malus x floribunda, Malus x micromalus, Malus x zumi. Уровень сходства в пределах кластера варьирует от 0,31 до 0,66. Наибольшее сходство установлено между следующими парами видов: яблоня Пратта - яблоня микрояблоня, яблоня Холла - яблоня Цуми, яблоня ганьсуйская - яблоня трехлопастная, яблоня ягодная - яблоня торинговидная. В данный кластер вошли восточноазиатские виды яблони, а также большинство гибридогенных видов.

В кластер 3 вошли 8 видов: Malus angustifolia, Malus asiatica, Malus coronaria, Malus ioensis, Malus laosensis, Malus mandshurica, Malus orientalis, Malus sieversii. Наибольшее сходство обнаружено у пары видов: яблоня лаосская - яблоня восточная.

В кластер 4 вошел 1 вид: Malus sylvestris.

В кластер 5 вошел 1 вид: Malus toringo.

В кластер 6 вошел 1 вид: Malus yunannensis.

Представляет интерес сравнить результаты кластеризации видов яблони по невесовой (кластерный анализ) и весовой (таксономический анализ Е.С.Смирнова) таксономиям (табл. 6)

Рис. 3. Дендрит максимальных коэффициентов сходства по Е.С.Смирнову 31 вида яблони по 25 признакам

Таблица 6. Состав кластеров при невесовой (кластерный анализ) и весовой (таксономический анализ Е.С.Смирнова) таксономиям

№ кластера

Вид

Секция, серия по В.Т.Лангельфельду

№ кластера

Вид

Секция, серия по В.Т.Лангельфельду

Кластерный анализ

Таксономический анализ Е.С.Смирнова

1

M.mandshurica

Gymnomeles, baccatae

1

M. fusca

Sorbomalus, fuscae

M.sargentii

Sorbomalus, toringonae

M. honanensis

Sorbomalus, yunnanensis

M.sikkimensis

Docyniopsis

M. x prunifolia

гибридогенный вид

M.trilobata

Eriolobus

M.sikkimensis

Docyniopsis

M.yunnanensis

Sorbomalus, yunnanensis

M. x spectabilis

гибридогенный вид

2

M.fusca

Sorbomalus, fuscae

M. tschonoskii

Docyniopsis

M.honanensis

Sorbomalus, yunnanensis

2

M.baccata

Gymnomeles, baccatae

M.kansuensis

Sorbomalus, kansuensis

M.halliana

Gymnomeles, hupehenses

M.prattii

Sorbomalus, yunnanensis

M.himalaica

Gymnomeles, baccatae

M.toringoides

Sorbomalus, kansuensis

M.hupehensis

Gymnomeles, hupehenses

M.transitoria

Sorbomalus, kansuensis

M.kansuensis

Sorbomalus, kansuensis

3

M.baccata

Gymnomeles, baccatae

M.prattii

Sorbomalus, yunnanensis

M.x floribunda

гибридогенный вид

M.sargentii

Sorbomalus, toringonae

M.halliana

Gymnomeles, hupehenses

M. х sieboldii

гибридогенный вид

M. himalaica

Gymnomeles, baccatae

M.toringoides

Sorbomalus, kansuensis

M.hupehensis

Gymnomeles, hupehenses

M.transitoria

Sorbomalus, kansuensis

M. x micromalus

гибридогенный вид

M.trilobata

Eriolobus

M. x prunifolia

гибридогенный вид

M. x floribunda

гибридогенный вид

M. x sieboldii

гибридогенный вид

M. x micromalus

гибридогенный вид

M. x spectabilis

гибридогенный вид

M. x zumi

гибридогенный вид

M. x zumi

гибридогенный вид

3

M.angustifolia

Choromeles, coronariae

4

M.angustifolia

Choromeles, coronariae

M.asiatica

Malus, asiaticae

M.asiatica

Malus, asiaticae

M.coronaria

Choromeles, coronariae

M.coronaria

Choromeles, coronariae

M.ioensis

Choromeles, coronariae

M.ioensis

Choromeles, coronariae

M.laosensis

Docyniopsis

M.laoensis

Docyniopsis

M.mandshurica

Gymnomeles, baccatae

M.orientalis

Malus, orientales

M.orientalis

Malus, orientales

M.sieversii

Malus, sieversinae

M.sieversii

Malus, sieversinae

M.sylvestris

Malus, malus

4

M.sylvestris

Malus, malus

M.toringo

Sorbomalus, toringonae

5

M.toringo

Sorbomalus, toringonae

M.tschonoskii

Docyniopsis

6

M.yunannensis

Sorbomalus, yunnanensis