Материал: 6251

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

В выражении (4.3.5) x – вектор состояния, p – вектор количества движения, u – вектор управления. При записи формулы (4.3.5) учтены уравнения динамики (4.3.3).

Простота функции Гамильтона делает весьма привлекательной идею о том, что из условий максимума функции Гамильтона можно получить условия минимума функции Понтрягина. Л.С. Понтрягин первым догадался сделать такой вывод и назвал свое открытие принципом максимума.

Принцип максимума гласит, что если вектор управления u оптимален, то есть доставляет минимум функции Понтрягина, то функция Гамильтона H имеет максимум по отношению к u в интервале управления.

Применение принципа максимума к решению задач оптимального управления заключается в определении условий максимума гамильтониана H по отношению к вектору управления. Результатом этого этапа будет вектор оптимального управления как функция вектора количества движения u (p). Но при проектировании систем оптимального управле-

ния необходимо определить закон управления как функцию вектора состояния u (x) или как функцию времени u (t). Потому следующий этап

– подстановка найденного вектора оптимального управления u (p) в ка-

нонические уравнения Гамильтона. Очередной этап состоит в решении получающейся при этом двухточечной краевой задачи с граничными условиями. В результате получаем оптимальную траекторию x (t) и оп-

тимальное управляющее воздействие u (t).

Итак, заданы уравнения динамики основной системы (4.3.3)

241

xɺi = fi (x,u,t), i =1,2,...,n .

Вектор количества движения определится как решение дифференциальных уравнений сопряжённой системы

ɺ

f j

 

 

n

 

 

 

pi = −pj

 

, i =1,2,...n ,

(4.3.6)

xi

j=1

 

 

с граничными условиями pi (t f )= −bi , где bi – известные константы, вхо-

дящие в функцию Понтрягина ρ (4.3.4).

Связать уравнения (4.3.3) и (4.3.6) можно с помощью функции Гамильтона (4.3.5). Продифференцируем функцию Гамильтона Н сначала по pi

H = fi (x,u,t),

pi

а затем по xi

H

n

f j

 

 

= pj

 

.

x

x

j=1

 

i

i

 

Учитывая уравнения (4.3.3) и (4.3.6), получаем канонические уравнения Гамильтона

ɺ

=

H

,

 

 

 

 

xi

pi

 

 

 

 

(4.3.7)

 

 

 

H

ɺ

= −

,

pi

xi

 

 

 

 

242

с граничными значениями xi (t0 )= xi0 , и pi (t f )= −bi , i =1,2,...n.

Физическую интерпретацию принципа максимума можно пояснить следующим образом: функция Гамильтона H представляет собой скалярное произведение p на f или p на xɺ и является мощностью, если p рассматривать как количество движения. Поэтому для минимизации функции Понтрягина ρ необходима максимальная энергия, и наоборот, когда ρ минимальна, H максимальна.

Функция Понтрягина ρ, определяемая выражением ρ = b,x f , и гра-

ничные условия pi (t f )= −bi справедливы для процессов управления с произвольным конечным состоянием. Если же на конечное состояние накладываются ограничения вида

Rk (x f )= 0, k =1,2,...,r, r {1,2,...,n},

(4.3.8)

то функция Понтрягина принимает вид

ρ = bT x f + λT R(x f ),

где λ – векторный множитель Лагранжа.

В этом случае канонические уравнения Гамильтона подчинены граничным условиям

x(t0 )= x0 ,

 

 

 

 

 

 

r

R

k

 

pi (t f

)= − bi

+ λk

 

.

 

 

 

 

k=1

xi

243

При этом конечные условия для xf удовлетворяют ограничениям (4.3.8).

Пример 4.3.1. Определим оптимальное управление линейным объектом первого порядка

xɺ = −ax + γu ,

где а и γ – некоторые положительные константы. Критерий качества – квадратичный

I(u)= tf x2 (u,t)dt ,

t0

а управление ограничено u M .

Перейдём к обобщённой задаче оптимального управления. Для этого обозначим x1 = x и введём дополнительную компоненту вектора состоя-

t

ния x2 = x12 dt . Тогда уравнения динамики будут иметь вид

t0

xɺ1 = −ax1 + γu,

xɺ2 = x12.

В связи с тем, что минимизировать теперь требуется x2 (tf ), функция Понтрягина определится выражением

ρ = b1x1 + b2 x2 = x2 ,

244

где b1=0, b2=1.

Составим функцию Гамильтона для данной системы

H = p1 f1 + p2 f2 = p1(ax1 + γu)+ p2 x12 .

Принцип максимума требует, чтобы управление u обеспечивало бы максимум функции Гамильтона. Из вида функции Гамильтона следует, что максимальное значение она будет принимать тогда, когда знак управления u будет совпадать со знаком p1, а абсолютное значение u будет максимальным, то есть М. Таким образом, общий характер оптимального управления установить довольно просто

u = M sign p ,

(4.3.9)

1

 

где знаковая функция

1 при α > 0, signα = 0 при α = 0,-1 при α < 0.

Канонические уравнения Гамильтона имеют вид

 

 

H

 

xɺ1 = −ax1 + γu,

xɺi

=

 

 

 

pi

 

 

 

xɺ2 = x12 ,

pɺi

= −

H

pɺ1 = ap1 2x1 p2 ,

xi

 

 

 

 

pɺ2 = 0.

Начальные условия для вектора состояния x

245