где операторы и * означают корреляцию и свертку, соответственно; х3 и у3 - координаты в выходной плоскости Р3.
Таким образом, в плоскости Р3 в центре координат наблюдаются функции автокорреляции сигналов (изображений s и r) - первые два члена в последней формуле, а на расстояниях х3=2а и х3=-2а - функции взаимной корреляции сигналов s и r. Если распознаваемый объект s подобен эталону r (или одному из изображений, содержащихся в r), то в корреляционной плоскости Р3 будет иметь место пик относительно большой освещенности, положение которого строго соответствует координате распознаваемого объекта s.
Схема простейшего коррелятора описанного типа представлена на рис. 29, б.
Объектив О строит изображение просматриваемой сцены (кадра) на многоэлементном приемнике излучения МПИ1. Сигналы с этого приемника (электронное изображение) поступают на микропроцессор МП, а затем на одну из половин транспаранта, например, пространственно-временномго модулятора ПВМ1. На второй половине транспаранта строится эталонное изображение того объекта, который необходимо обнаружить или распознать. Транспарант облучается (подсвечивается) линейно-поляризованным когерентным излучением, создаваемым лазером Л. Оба изображения подвергаются Фурье-преобразованию с помощью Фурье-объектива Ф-01. Полученный на входе второго пространственно-временномго модулятора ПВМ2, облучаемого когерентным излучением, спектр мощности преобразуется по Фурье объективом Ф-02. Функция Е3(х3, у3) строится в плоскости чувствительного слоя многоэлементного приемника излучения МПИ2. Сигнал, соответствующий функции взаимной корреляции s (x, у) и r (х, у), с этого приемника поступает на микропроцессор МП, а затем на систему отображения СО.
Измеряя координаты пика корреляционной функции, можно определить положение объекта, а также скорость его движения. При наличии в угловом поле нескольких объектов, каждый из которых будет создавать свой корреляционный пик, можно построить алгоритм обработки сигналов так, чтобы идентифицировать отдельные объекты по скорости их видимого движения.
Адаптивные свойства коррелятора-преобразователя позволяют осуществлять слежение за объектами, меняющими свою ориентацию и масштаб изображения.
Корреляторы описанного типа позволяют решать задачи обнаружения, селекции и слежения за подвижными объектами в реальном масштабе времени. В отличие от ряда других известных когерентных корреляторов для них не требуются голографические элементы и специальные фазовые фильтры, они стабильны в работе. Важными достоинствами этих корреляторов являются сравнительно простая конструкция, возможность осуществлять согласованную фильтрацию, адаптируясь к виду оптического сигнала (изображения) путем принятия каждого предыдущего кадра за эталонное изображение для его корреляции с текущим кадром. Если цикл обработки сигнала принять коротким, так чтобы обнаруживаемый или отслеживаемый сигнал был стационарным в течение нескольких кадров, то в выходной плоскости коррелятора (на МПИ2) будет создаваться достаточно мощный сигнал.
Наиболее сложными компонентами схемы, представленной на рис. 30, являются многоэлементные приемники, ПВМ, а также Фурье-объективы. Определенные трудности может представить необходимость обеспечения широкого углового поля объектива с сохранением хорошего качества изображения по всему полю, а также обеспечение высокого и стабильного пространственного разрешения МПИ, т.е. выбор приемника с большим числом элементов малых размеров.
11. Общие сведения из теории распознавания образов
Описанные способы выделения полезного сигнала на фоне помех и шумов можно рассматривать как частные случаи решения общей задачи распознавания образов. Все наблюдаемые или исследуемые с помощью прибора объекты или создаваемые ими сигналы можно разделить на отдельные классы по ряду признаков - свойств объекта или сигнала, поддающихся количественному описанию: по спектру излучения, размерам, времени появления и т.д. Процесс распознавания сводится к определению класса наблюдаемого объекта или сигнала, т.е. к его идентификации с одним из возможных эталонов, характеризующим этот класс. Структурная схема системы распознавания представлена на рис. 30.
Рис. 30. Структурная схема системы распознавания: ПО - поле объектов; ПС - приемная система; ВП - блок выделения признаков; ПР - блок принятия решений; БЭ - блок эталонов
После прохождения приемной системы или системы первичной обработки информации сигнал представляет собой функцию некоторого числа переменных (х1, x2, …, хn), одни из которых более информативны, т.е. лучше описывают специфику сигнала, другие - менее. Целесообразно в дальнейших звеньях системы распознавания использовать по возможности ограниченное число признаков, чтобы не перегружать ее память (память ЭВМ) и не усложнять конструкцию. Поэтому в состав системы часто вводят блок выделения таких признаков (у1, у2, …, yт), причем тп.
Принятие решения о принадлежности сигнала к тому или иному классу выполняется классификатором (блоком принятия решения). Этот блок выполняет две задачи: сначала разбивает пространство измерений (признаков, сигналов) на области решения, т.е. находит разделяющие их функции, а затем отождествляет любой сигнал (вектор измерения) с каким-либо из классов (областей) признаков.
Рассмотрим случай распознавания оптического сигнала - излучения какого-либо черного тела по создаваемой им освещенности в плоскости входного зрачка ОЭП. Эта монохроматическая освещенность может быть описана формулой
Рис. 31. Признаки объектов в области (El1, El2): а - кластеры сигналов; б - кривые El для двух излучателей
Объекты (сигналы) могут быть отнесены к тому или иному классу по разным правилам. Одним из простейших случаев является тот, когда удается установить линейные границы разделения классов (границы решения), например прямые линии, равноудаленные от точек, соответствующих средним значениям сигналов, относящихся к тому или иному классу.
Обычно при распознавании используются вероятностные методы и методы теории статистических решений. Если законы распределения, характеризующие признаки различных объектов или явлений различных классов, могут быть представлены кривыми, которые не пересекаются, то объект или явление можно достоверно отнести к одному из классов. На практике почти всегда указанные кривые пересекаются, и для оценки вероятности принадлежности сигнала к тому или иному классу рассматриваются полные вероятности этой принадлежности.
В общем случае для распознавания сигнала (образа) можно использовать п признаков. Тогда этот сигнал можно представить точкой или вектором в n-мерном пространстве.
Критерий распознавания - правило, по которому определяется поверхность, разделяющая классы в n-мерном пространстве первичных признаков. Обычно распознаются объекты по признакам одной и той же физической природы, но вероятностное их распределение различно.
Распространенными критериями распознавания являются критерий максимальной плотности вероятности n-мерного распределения в данной точке пространства первичных признаков и критерий минимума среднего квадратического отклонения значения сигнала от эталона.
Рассмотрим простейший пример двумерного распределения, когда случайная точка на плоскости признаков El1, El2 (см. рис. 31) относится к классу A1 или А2 по максимуму величины:
,
Уравнение оптимальной решающей границы разделения классов А1 и А2 может быть получено при гауссовских кривых рA1 и рA2 из условия
в виде уравнения второго порядка:
,
где А, В, С, D, Е, F - постоянные коэффициенты, определяемые математическими ожиданиями, дисперсиями, коэффициентами корреляции, входящими в выражения для pA1 и pA2, a также весами р1 и р2. Это выражение (дискриминантная функция) в общем виде описывает плоские кривые 2-го порядка: окружность, эллипс, гиперболу, а при А=В=С=0 - прямую линию.
Дискриминантными (решающими, разделяющими) функциями называется множество функций х, т.е. g1(x), g2(x), …, gm(x), обладающее тем свойством, что gi(x) имеет большее значение, чем все остальные функции g, в том случае, если х принадлежит к i-й области. Предположим, что имеется т классов и соответствующие им области решения. Для классификации любого сигнала хk нужно вычислить значения g1(xk), g2(xk), …, gm(xk). Сигнал хk будет принадлежать тому классу, для которого функция g имеет наибольшее значение.
Решающие функции обычно вычисляют на основе информации, извлекаемой из набора сигналов с известной классификацией. Создание классификатора называется его обучением.
Если функции распределения вероятностей, связанные с тем или иным классом, известны, то для обучающего набора сигналов нужно оценить параметры этих распределений (математическое ожидание, дисперсию и др.), что снижает требования к емкости памяти ЭВМ, необходимой для обучения.
Для многомерных гауссовских распределений обычно применяют вектор математического ожидания и ковариационную матрицу для каждого класса сигналов (образов).
Если при распознавании используются п сигналов, например п значений яркости в п областях спектра, то для обучения необходимо иметь, как минимум, 10n (и даже более) обучающих сигналов (образов).
Оптимальный набор решающих функций g находят с помощью теории статистических решений. Так, в случае задачи об отнесении сигнала к той или иной области по максимуму правдоподобия ЭВМ вычисляет произведения функции плотности вероятности рsi(хi) на опорные вероятности класса i-p(si), т.е. на вероятности наблюдения сигнала si. Эти произведения и образуют набор решающих функций.
Более сложным является определение решающих функций в случае многомодального распределения случайных сигналов, что довольно часто встречается в практике работы ОЭП. Обычно такой класс разбивается на несколько подклассов, для каждого из которых функция распределения вероятностей может быть принята гауссовской.
Критерий максимума функции распределения плотности вероятности сводится часто к максимуму функции правдоподобия в предположении, что имеет место гауссовский закон распределения случайных величин, описывающих распознаваемый сигнал и параметры всей системы (их «случайные части»).
Представим сигнал на выходе ОЭП или какого-либо его звена в виде вектора у с компонентами уj
(31)
где xj(a) - j-я компонента входного сигнала, который часто принимается детерминированным; kj(a) - коэффициент передачи (чувствительность) ОЭП, который часто также принимается детерминированной величиной; a - один из возможных аргументов (пространственная или угловая координата, длина волны излучения, время и т.д.).
В общем случае функции yj, хj, kj носят случайный характер. Число составляющих j=1, 2,…, J векторов у и k определяется как число каналов J, например спектральных, в которых идет работа прибора.
Возможен случай, когда аргумент a является, в свою очередь, многомерной векторной величиной, например, если в канале j сигнал х рассматривается одновременно как функция двух пространственных координат и длины волны излучения.
В силу случайности величин, входящих в (31), вектор выходного сигнала у является многомерной случайной величиной со средним значением и ковариационной матрицей , имеющими компоненты:
mj = <yj> и Cjj = <(yj - mj) (yj - mj)>,
где <·> обозначает среднее по ансамблю случайных величин.
Обнаружение (распознавание) какого-то частного значения вектора сигнала у обычно основывается на сравнении полученных значений mу с рядом эталонных значений средних величин mу и матрицы Cij с рядом матриц, хранящихся в памяти блока сравнения. В случае применения критерия минимума среднего квадратического отклонения не используется информация, содержащаяся в ковариационной матрице. Поэтому алгоритм обнаружения, сводящийся к нахождению минимального значения | у-mу| 2, менее точен, чем алгоритм, основанный на максимизации функции плотности вероятности гауссовского случайного процесса: