− |
∂R |
= min{r(x(t),u(t),t)+ < grad R ,f >}. |
(4.4.9) |
|
|
∂t |
u(t) |
x |
|
|
|
|
|
|
Введя обозначение p = gradx R для обобщённого вектора количества движения и H(x,u,p,t)=<p,f > +r для функции Гамильтона, выражение (4.4.9) превратим в уравнение
−∂R = min H(x,u,p,t).
∂t u(t )
Подставив в полученное уравнение оптимальное управление u (t)и оптимальную траекторию x (t), получим классическое уравнение Гамильтона−Якоби
−∂R = H(x ,u ,p,t),
∂t
дополненное условием
min{r(x(t),u(t),t)+ < grad R ,f >}. |
(4.4.10) |
u(t) |
x |
|
Условие (4.4.10) обеспечивается, если приравнять нулю производную по u от выражения в фигурных скобках
grad |
u |
r+ < grad |
x |
R ,f >= 0 . |
(4.4.11) |
|
|
|
|
Итак, в случае непрерывных систем с уравнениями объекта
261
xɺ = f(x,u)
и интегральным критерием
t f
R = ∫r(x,u,t)dt
t0
принцип динамического программирования приводит к уравнению Беллмана
r(x ,u ,t)+ ∂∂R + < gradx R ,f >= 0 , t
где R = min R , а u и x - оптимальное управление и оптимальная траектория движения объекта соответственно, дополненное уравнением (4.4.11) относительно R .
В простейшем случае, когда имеется система первого порядка и ска-
лярное управление, уравнение объекта имеет вид |
x = f (x,u). Уравнение |
||||||
|
|
|
|
|
|
|
ɺ |
Беллмана в этом случае будет |
|
|
|
|
|
||
r(x ,u ,t)+ |
∂R |
+ ∂R |
f = 0 , |
(4.4.12) |
|||
|
|
|
∂t |
∂ x |
|
|
|
а необходимое условие минимума критерия |
|
|
|||||
|
∂ r |
+ |
∂ f |
∂ R |
= 0 . |
|
|
|
|
∂ x |
|
||||
|
∂u |
∂u |
|
|
|
||
262 |
|
|
|
|
|
|
|
Оптимальное управление, таким образом, будет релейным u = ±M в
соответствии со знаком функции ∂R , удовлетворяющей нелинейному
∂ x
дифференциальному уравнению в частных производных
− |
∂R |
= x2 − ax |
∂R |
− γ M |
∂R |
|
∂t |
|
∂ x |
|
∂ x |
с граничными условиями x(t0 )= x0 ;R (x,t f )= 0 .
Как видно, сравнительно легко устанавливается общий характер оптимального управления, однако определение линии переключения – отнюдь не простая задача. Аналитическое решение подобного рода задач возможно только в исключительных случаях и приходится прибегать к численным методам.
Сформулируем некоторые выводы.
1.Метод динамического программирования приводит к необходимости решения уравнения Беллмана или Гамильтона−Якоби.
2.Для решения уравнений Гамильтона−Якоби можно воспользоваться методами, описанными в стандартных учебниках классической механики и курсах прикладной математики для некоторых частных случаев.
3. В общем случае нет метода, позволяющего определить R и u в
аналитическом виде. Для решения же задач численными методами требуется объем вычислений, затруднительный даже для современных ЦВМ.
265