Главное управление криминалистики, Следственный комитет Российской Федерации
МГУ им. М.В. Ломоносова
Морфологическая типология лица и возможности ее применения для идентификации личности
Веселкова Дарья Владимировна
аспирантка кафедры антропологии биологического факультета
Гончарова Наталия Николаевна
кандидат биологических наук
старший преподаватель кафедры антропологии
биологического факультета
Абрамов Алексей Сергеевич
кандидат медицинских наук, старший эксперт
отдел медико-биологических исследований
управление организации
экспертно-криминалистической деятельности
Аннотация
типология поиск изображение координата
Разработка инструментов, повышающих точность идентификации, не теряет своей актуальности. Применительно к этой задаче, морфологическая типология лиц, созданная нами с применением метода главных компонент, позволяет учесть закономерности взаимной изменчивости признаков лица, что делает его описание более объективным. Типология представляет собой систему трёх координат (первых трёх главных компонент), в которых положение любого индивида легко рассчитываются по готовым уравнениям. В данной статье мы рассмотрели возможность применения типологии для сужения круга поиска изображений с помощью указания границ значений для каждой координаты. Кроме того, предложен метод определения частоты встречаемости определённого сочетания признаков и выявления редких/частых сочетаний для двумерного и многомерного пространства.
Ключевые слова: типология лица, идентификация личности, метод главных компонент.
D.V. Veselkova, N.N. Goncharova, A.S. Abramov. A morphological typology of a face and its applicability for identification.
Annotation
Development of tools to improve the accuracy of identification does not lose its relevance. For this task, the morphological typology of faces we created using principal component analysis, allows to take into account the regularities of mutual variation of face characteristics that makes its description more objective. This typology is a system of three coordinates (the first three principal components) in which the position of any individual is easily calculated by the developed equations. In this article, we considered the possibility of its application to narrow down the search range of images by specifying the boundaries of the values for each coordinate. In addition, the method of determining the frequency of occurrence of a particular combination of characteristics and identification of rare/common combinations for two-dimensional and multidimensional space was proposed.
Key words: face typology, personal identification, principal component analysis (PCA).
Введение
В экспертной практике нередко встает проблема работы с большими массивами информации, когда необходимо максимально сузить круг поиска или уменьшить количество объектов, например, для краниофациальной идентификации. В частности, это касается работы с изображениями, т.к. сейчас возможности для фото- и видеосъёмки очень широки. Для поиска и анализа изображений используется в числе прочих антропометрический алгоритм, предполагающий использование определенного набора точек и параметров лица, на основе которых производится сравнение. Причем выбор признаков чаще всего обусловлен точностью их определения в автоматическом режиме, но не способностью лучше описывать изменчивость лица.
Нами была разработана типология (Веселкова и др. 2016), которая позволяет учесть закономерности взаимной изменчивости некоторых признаков лица. Использование такого подхода при поиске изображений может сделать его более объективным, т.к. учитывается не только величина признака, но и его связь с другими параметрами лица, следовательно, в качестве наиболее близких будут выделяться индивиды с действительно схожим строением лица, а не просто с близкими размерными характеристиками. Типологический подход здесь обусловлен его удобством - при типологизации, или выделении типов, из множества признаков, по которым можно описать человека, выбираются только наиболее важные, что значительно упрощает восприятие и понимание информации. В частности, типологическое описание морфологии лица широко применяется в антропологической и криминалистической практике (см. напр.: Герасимов 1955; Снетков и др. 1970; Балуева, Лебединская 1997; Веселовская 2015). Другой известный вид типологий - морфологические конституциональные схемы. Наша схема была разработана по аналогии с одной из таких схем - конституциональной схемой В.Е. Дерябина (Дерябин 2006). Им был сформулирован подход (Дерябин 1986; Дерябин 2008), позволяющий с помощью методов многомерной статистики учесть непрерывную изменчивость количественных признаков, коими являются измерительные признаки тела и лица человека, и найти место каждого индивида в общем ряду изменчивости. Иными словами, классифицировать индивида на основании целого набора измерительных признаков. Типология, построенная по этому принципу, является, по сути, системой координат, в которой отдельные типы выделяются лишь условно, для удобства использования, фактически же для каждого индивида вычисляются три координаты, определяющие его положение в типологической схеме.
При построении морфологической типологии лица подход В.Е. Дерябина был впервые применен М.А. Негашевой (Negascheva 2000) для описания связи признаков лица с соматическими признаками. Наша типологическая схема в целом повторяет выявленные закономерности изменчивости, однако базируется на ином наборе признаков и уделяет больше внимания центральной части лица. Также мы опробовали её для поиска близких индивидов и частых/редких сочетаний признаков с целью создать ещё один инструмент анализа изображений.
Материалы и методы
В работе использованы фотографии анфас 680 человек (таблица 1).
Таблица 1. Поло-возрастное распределение индивидов в исследуемой выборке
|
Возрастная группа/Пол |
Мужчины |
Женщины |
|
|
16-25 лет |
444 |
106 |
|
|
26-45 лет |
108 |
22 |
|
|
Всего |
552 |
128 |
Примечание. Границы интервалов выбраны в соответствии с ранее установленным возрастом смены общегражданского паспорта, т.к. большая часть выборки была классифицирована по этому принципу.
следственные и паспортные фото (453) из базы данных МВД, предоставленные ООО «БАРС Интернешнл»;
антропологические фотографии из коллекций кафедры антропологии и лаборатории реконструкции Института этнологии и антропологии РАН (227).
Поскольку основной объем выборки составляют фото из базы данных МВД, разнесенные в две возрастные группы, оставшаяся часть фотографий делилась по этому же принципу.
Поскольку нашей целью было создание универсальной типологии, в дальнейших исследованиях выборка не разделялась на возрастные группы.
Измерения проводились в программе «Барс Поиск 4.1», в модуле «Барс Эксперт 1.1». Статистическая обработка данных выполнена в программе «STATISTICA 8».
Рис. 1. Размеры, используемые в программе «Барс Поиск».
Программа «Барс Поиск» предназначена для поиска в заданной пользователем базе данных тех фотографий, которые наиболее близки по параметрам к исследуемому изображению. Алгоритм антропометрического сравнения использует 18 точек и 8 размеров лица. Антропометрические точки и размеры, задействованные в программе (таблицы 2 и 3, рис. 1), взяты из методики А.М. Зинина (Зинин 2006), которая часто называется габитоскопической. В ее основе лежит классическая антропометрическая методика измерений В.В. Бунака (Бунак 1941), адаптированная к портретной экспертизе, т.е. к расстановке точек на фотографии.
Таблица 2. Точки, используемые в программе «Барс Поиск»
|
Наименование точек |
Место размещения точек на изображении |
|
|
0 (01) - Надкозелковые |
точки, находящиеся на границе козелка и начального завитка |
|
|
4 (41) - Внутренние глазные (углы глаз) |
точки слияния внутреннего края верхнего и нижнего века в области переносья |
|
|
42 (43) - Зрачки глаз |
центральные точки зрачков глаз |
|
|
5 (51) - Наружные глазные (углы глаз) |
точки слияния внутренних краев верхнего и нижнего века в области висков |
|
|
52 - Наружноглазная вспомогательная |
точка в области переносья, находящаяся на пересечении срединной вертикальной линии с горизонтальной, проходящей через точки 5 и 51 |
|
|
61 (62) - Нижненосовые |
крайние точки крыльев носа, находящиеся на пересечении касательных вертикалей к крыльям носа с линией, соединяющей нижние точки слияния крыльев носа с верхней губой |
|
|
6 - Нижненосовая вспомогательная |
точка пересечения срединной вертикали с линией, соединяющей точки 61 и 62 |
|
|
81 (82) - Верхнегубные |
наиболее выступающие точки верхней линии каймы верхней губы |
|
|
9 - Ротовая |
точка на срединной вертикали, разделяющая каймы верхней и нижней губ |
|
|
10 - Нижнегубная |
наиболее опущенная вниз точка линии каймы нижней губы |
|
|
11 (111) - Крайнегубные (углы рта) |
крайние точки видимой части каемок губ |
|
|
14 - Подподбородочная |
наиболее низко расположенная (под костной частью) точка на контуре подбородка |
Таблица 3. Размеры, используемые в программе «Барс Поиск»
|
Габитоскопические размеры |
Используемые точки |
|
|
Высота лица |
(52-14)/(42-43) |
|
|
Ширина лица |
(0-01)/(42-43) |
|
|
Ширина глазной щели |
(5-4)/(42-43) |
|
|
Ширина носа |
(61-62)/(42-43) |
|
|
Ширина рта |
(11-111)/(42-43) |
|
|
Высота носа |
(52-6)/(42-43) |
|
|
Высота рта* |
(52-9)/(42-43) |
|
|
Толщина губ |
((8+81)/2-10)/(42-43) |
Все размеры выводятся в отношении к межзрачковой ширине (42 - 43). Это сделано с целью избавиться от размерности - на фотографиях, как правило, нет масштабирующих элементов, как следствие, нет возможности перейти к абсолютным величинам, и в таком случае использование относительных размеров позволяет анализировать любые изображения, делает программу более универсальной. Межзрачковое расстояние легко размечается на фотографии, что делает его подходящей единицей форматирования.
Суть метода главных компонент, использованного для построения морфологической типологии, состоит в создании новых признаков - главных компонент - на основе набора исходных данных. Новые признаки получаются в результате суммирования исходных признаков, домноженных на определённые коэффициенты, так называемые нагрузки признаков на главные компоненты, которые наилучшим образом отражают вклад каждого исходного признака в новый. По сути, каждый новый признак аккумулирует в себе исходные, поэтому для описания большей части изменчивости достаточно проанализировать меньшее количество новых признаков.
Типология лиц по результатам многомерного анализа
Подробно разработанная нами типология описана в статье (Веселкова и др. 2016), здесь мы лишь кратко излагаем её основные принципы.
Типологическая схема представляет собой систему трёх координат (отдельно для мужчин и для женщин) - первых трёх главных компонент, которые суммарно описывают 68,2% и 69,1% изменчивости для мужчин и женщин соответственно. Первая главная компонента учитывает тотальные размеры лица, разделяя всю выборку по вектору микро-/макросомии таким образом, что на одном полюсе нового признака (первой главной компоненты) оказываются крупные лица, причем большую значимость для разделении лиц оказывают высотные размеры лица. Вторая главная компонента разделяет всю выборку на основании соотношений высоты и ширины лица, третья учитывает соотношение размеров рта и носа, т.е. центральную часть лица. Наглядно представить типологию помогает рисунок 2 (рис. 2). Для упрощения картины здесь рассматривается распределение индивидов в пространстве только второй и третьей главных компонент.
Рис. 2. Распределение индивидов в пространстве второй и третьей главных компонент (мужчины)
По второй главной компоненте на одном полюсе оказываются индивиды с широким в целом лицом, широкими носом и ртом, но небольшой верхней высотой лица и, соответственно, небольшой высотой носа; на другом полюсе помещаются индивиды с вытянутым, относительно узким лицом, высоким и узким носом и нешироким ртом. По третьей главной компоненте выделяются люди с невысоким носом, но толстыми губами, и люди с высоким носом и тонкими губами. Закономерности изменчивости признаков в женской выборке аналогичны.
Определение положения индивида в пространстве главных компонент
Индивидуальные значения первой, второй и третьей главных компонент для любого индивида (в том числе не входившего в исходную выборку, на основе которой получены предложенные уравнения) можно получить по готовым формулам, рассчитанным на основе метода В.Е. Дерябина (Дерябин 2008):
для мужчин
y1j = - 0,2280X1j - 0,1919X2. - 0,4712X3. - 0,4180X3 - 0,2811X3 - 0,2865X3
J 0,3439X7. - 0,2410X8 - 41,55;
y2j = - 0,0997X3 + 0,2159X2 - 0,1443X3j + 0,6791X4j + 0,4499X5. - 0,2612X6j
J 0,2439X7. - 0,2466X8 + 8,2732;
y3j = 0,0670X2 - 0,0702X2j - 0,1583X3. - 0,2001X4j - 0,0176X5. - 0,2992X6.
J 0,0970X7. - J 0,9705X8. - 1,1293.
для женщин
y1j = - 0,2390X3 - 0,2034X2. - 0,3774X3. - 0,3745X4. - 0,2622X5. - 0,3180X6.
J 0,3406X7. - 0,3919X8 - 41,4849;
y2. = - 0,1298X3 + 0,0918X2. + 1,2301X3. + 0,5581X4. + 0,4945X5. - 0,0111X6.
J 0,2214X7. - 0,4793X8 + 15,6956;
y3. = 0,0194X2 + 0,0552X2. - 1,3023X3. + 0,7573X4. + 0,2483X5. - 0,3600X6. - 0,1270X7. + 0,4332X8. - 1,5114.
Здесь Х1 - высота лица, Х2 - ширина лица, Х3 - ширина глазной щели, Х4 - ширина носа, Х5 - ширина губ, Х6 - высота носа, Х7 - высота губ, Х8 - толщина губ. Коэффициенты уравнения учитывают значения собственных векторов главных компонент и условия нормировки исходных признаков.
Полученные значения показываются степень отклонения индивида от центральной точки распределения всех индивидов в пространстве новых признаков.
С помощью этих уравнений можно не только вычислить положение индивида в пространстве главных компонент и тем самым точно определить, к какому типу он относится, но и отсеять заведомо отличающихся индивидов, задав нужные границы величин главных компонент. Например, ограничив значения второй и третьей главных компонент ±0,5 сигмы от координат выбранного индивида, что отмечен красной точной (рис. 3), мы получаем 9 близких по типу лиц (одно изображение не отражено на рисунке удобства ради).
Рис. 3. Выделение индивидов, близких по типу к исследуемому. Красный эллипс ограничивает область 0.5 сигмы от координат выбранного индивида)
Методы определения места индивида в многомерном пространстве признаков - инструменты для выделения редких и частых сочетаний