В выражении (4.3.5) x – вектор состояния, p – вектор количества движения, u – вектор управления. При записи формулы (4.3.5) учтены уравнения динамики (4.3.3).
Простота функции Гамильтона делает весьма привлекательной идею о том, что из условий максимума функции Гамильтона можно получить условия минимума функции Понтрягина. Л.С. Понтрягин первым догадался сделать такой вывод и назвал свое открытие принципом максимума.
Принцип максимума гласит, что если вектор управления u оптимален, то есть доставляет минимум функции Понтрягина, то функция Гамильтона H имеет максимум по отношению к u в интервале управления.
Применение принципа максимума к решению задач оптимального управления заключается в определении условий максимума гамильтониана H по отношению к вектору управления. Результатом этого этапа будет вектор оптимального управления как функция вектора количества движения u (p). Но при проектировании систем оптимального управле-
ния необходимо определить закон управления как функцию вектора состояния u (x) или как функцию времени u (t). Потому следующий этап
– подстановка найденного вектора оптимального управления u (p) в ка-
нонические уравнения Гамильтона. Очередной этап состоит в решении получающейся при этом двухточечной краевой задачи с граничными условиями. В результате получаем оптимальную траекторию x (t) и оп-
тимальное управляющее воздействие u (t).
Итак, заданы уравнения динамики основной системы (4.3.3)
241
xɺi = fi (x,u,t), i =1,2,...,n .
Вектор количества движения определится как решение дифференциальных уравнений сопряжённой системы
ɺ |
∂ f j |
|
|
|
n |
|
|
|
|
pi = −∑ pj |
|
, i =1,2,...n , |
(4.3.6) |
|
∂ xi |
||||
j=1 |
|
|
с граничными условиями pi (t f )= −bi , где bi – известные константы, вхо-
дящие в функцию Понтрягина ρ (4.3.4).
Связать уравнения (4.3.3) и (4.3.6) можно с помощью функции Гамильтона (4.3.5). Продифференцируем функцию Гамильтона Н сначала по pi
∂H = fi (x,u,t),
∂ pi
а затем по xi
∂H |
n |
∂ f j |
|
|
|
= ∑ pj |
|
. |
|
∂ x |
∂ x |
|||
j=1 |
|
|||
i |
i |
|
Учитывая уравнения (4.3.3) и (4.3.6), получаем канонические уравнения Гамильтона
ɺ |
= |
∂ H |
, |
|
|
|
|
|
|||
xi |
∂ pi |
|
|||
|
|
|
(4.3.7) |
||
|
|
|
∂ H |
||
ɺ |
= − |
, |
|||
pi |
∂ xi |
||||
|
|
|
|
||
242
с граничными значениями xi (t0 )= xi0 , и pi (t f )= −bi , i =1,2,...n.
Физическую интерпретацию принципа максимума можно пояснить следующим образом: функция Гамильтона H представляет собой скалярное произведение p на f или p на xɺ и является мощностью, если p рассматривать как количество движения. Поэтому для минимизации функции Понтрягина ρ необходима максимальная энергия, и наоборот, когда ρ минимальна, H максимальна.
Функция Понтрягина ρ, определяемая выражением ρ = b,x f , и гра-
ничные условия pi (t f )= −bi справедливы для процессов управления с произвольным конечным состоянием. Если же на конечное состояние накладываются ограничения вида
Rk (x f )= 0, k =1,2,...,r, r {1,2,...,n}, |
(4.3.8) |
то функция Понтрягина принимает вид
ρ = bT x f + λT R(x f ),
где λ – векторный множитель Лагранжа.
В этом случае канонические уравнения Гамильтона подчинены граничным условиям
x(t0 )= x0 , |
|
|
|
|
|
|
|
r |
∂ R |
k |
|
pi (t f |
)= − bi |
+ ∑λk |
|
. |
|
|
|
||||
|
|
k=1 |
∂ xi |
||
243
При этом конечные условия для xf удовлетворяют ограничениям (4.3.8).
Пример 4.3.1. Определим оптимальное управление линейным объектом первого порядка
xɺ = −ax + γu ,
где а и γ – некоторые положительные константы. Критерий качества – квадратичный
I(u)= t∫f x2 (u,t)dt ,
t0
а управление ограничено u ≤ M .
Перейдём к обобщённой задаче оптимального управления. Для этого обозначим x1 = x и введём дополнительную компоненту вектора состоя-
t
ния x2 = ∫ x12 dt . Тогда уравнения динамики будут иметь вид
t0
xɺ1 = −ax1 + γu,
xɺ2 = x12.
В связи с тем, что минимизировать теперь требуется x2 (tf ), функция Понтрягина определится выражением
ρ = b1x1 + b2 x2 = x2 ,
244
где b1=0, b2=1.
Составим функцию Гамильтона для данной системы
H = p1 f1 + p2 f2 = p1(− ax1 + γu)+ p2 x12 .
Принцип максимума требует, чтобы управление u обеспечивало бы максимум функции Гамильтона. Из вида функции Гамильтона следует, что максимальное значение она будет принимать тогда, когда знак управления u будет совпадать со знаком p1, а абсолютное значение u будет максимальным, то есть М. Таким образом, общий характер оптимального управления установить довольно просто
u = M sign p , |
(4.3.9) |
1 |
|
где знаковая функция
1 при α > 0, signα = 0 при α = 0,-1 при α < 0.
Канонические уравнения Гамильтона имеют вид
|
|
∂H |
|
xɺ1 = −ax1 + γu, |
||
xɺi |
= |
|
|
|
||
∂ pi |
||||||
|
|
|
xɺ2 = x12 , |
|||
pɺi |
= − |
∂ H |
pɺ1 = ap1 − 2x1 p2 , |
|||
∂ xi |
|
|||||
|
|
|
pɺ2 = 0. |
|||
Начальные условия для вектора состояния x
245