Материал: 6251

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

R

= min{r(x(t),u(t),t)+ < grad R ,f >}.

(4.4.9)

 

t

u(t)

x

 

 

 

 

 

Введя обозначение p = gradx R для обобщённого вектора количества движения и H(x,u,p,t)=<p,f > +r для функции Гамильтона, выражение (4.4.9) превратим в уравнение

R = min H(x,u,p,t).

t u(t )

Подставив в полученное уравнение оптимальное управление u (t)и оптимальную траекторию x (t), получим классическое уравнение ГамильтонаЯкоби

R = H(x ,u ,p,t),

t

дополненное условием

min{r(x(t),u(t),t)+ < grad R ,f >}.

(4.4.10)

u(t)

x

 

Условие (4.4.10) обеспечивается, если приравнять нулю производную по u от выражения в фигурных скобках

grad

u

r+ < grad

x

R ,f >= 0 .

(4.4.11)

 

 

 

 

Итак, в случае непрерывных систем с уравнениями объекта

261

xɺ = f(x,u)

и интегральным критерием

t f

R = r(x,u,t)dt

t0

принцип динамического программирования приводит к уравнению Беллмана

r(x ,u ,t)+ R + < gradx R ,f >= 0 , t

где R = min R , а u и x - оптимальное управление и оптимальная траектория движения объекта соответственно, дополненное уравнением (4.4.11) относительно R .

В простейшем случае, когда имеется система первого порядка и ска-

лярное управление, уравнение объекта имеет вид

x = f (x,u). Уравнение

 

 

 

 

 

 

 

ɺ

Беллмана в этом случае будет

 

 

 

 

 

r(x ,u ,t)+

R

+ R

f = 0 ,

(4.4.12)

 

 

 

t

x

 

 

а необходимое условие минимума критерия

 

 

 

r

+

f

R

= 0 .

 

 

 

x

 

 

u

u

 

 

 

262

 

 

 

 

 

 

 

Решая последнее уравнение относительно

R

, получим

 

 

 

 

 

 

 

x

 

 

 

 

 

r

 

 

 

 

 

R

 

 

 

 

 

 

 

= −

 

u

 

= P(x,u).

(4.4.13)

 

x

f

 

 

 

 

 

 

 

u

Подставляя выражение (4.4.13) в уравнение (4.4.12) и решая послед-

нее относительно R , получим

t

 

 

 

r

 

 

 

R

 

 

 

 

 

 

= −r + f

 

u

 

= Q(x,u).

(4.4.14)

t

f

 

 

 

 

 

u

Продифференцируем уравнение (4.4.13) по t, а уравнение (4.4.14) – по x

2 R

xt

2 R

xt

=

P

 

u +

P

 

d x

,

 

 

 

 

u

t

x d t

=

Q + Q u .

 

x

u

x

Приравняв правые части полученных выражений, получим уравнение относительно оптимального управления

P

 

u + f

P

=

Q

+

Q

u

,

 

 

 

 

u

t

x

x

u

x

263

где P и Q определяются выражениями (4.4.13) и (4.4.14) соответственно.

Пример 4.4.2. Рассмотрим тот же линейный объект, что и в примере 4.3.1. Уравнение объекта

xɺ = −ax + γu ,

где а и γ – некоторые положительные константы. Критерий качества – квадратичный

I(u)= tf x2 (u,t)dt ,

t0

а управление ограничено

u

M .

t f

 

Введём функцию R (x,t)= min

 

x2dt

 

 

 

 

 

u

t

 

 

 

 

 

 

 

 

R

 

 

 

R

 

=

t

= min r(x,u)+

x

f

 

u

 

 

 

 

. Тогда из формулы (4.4.9) следует

min x2

+ R

(ax + γu) .

 

x

 

u

 

Из выражения в фигурных скобках видно, что его минимум будет в

том случае, если знак управления противоположен знаку R , а абсо-

x

лютное значение – максимально, то есть если

u= −M sign R .

x

264

Оптимальное управление, таким образом, будет релейным u = ±M в

соответствии со знаком функции R , удовлетворяющей нелинейному

x

дифференциальному уравнению в частных производных

R

= x2 ax

R

− γ M

R

 

t

 

x

 

x

с граничными условиями x(t0 )= x0 ;R (x,t f )= 0 .

Как видно, сравнительно легко устанавливается общий характер оптимального управления, однако определение линии переключения – отнюдь не простая задача. Аналитическое решение подобного рода задач возможно только в исключительных случаях и приходится прибегать к численным методам.

Сформулируем некоторые выводы.

1.Метод динамического программирования приводит к необходимости решения уравнения Беллмана или ГамильтонаЯкоби.

2.Для решения уравнений ГамильтонаЯкоби можно воспользоваться методами, описанными в стандартных учебниках классической механики и курсах прикладной математики для некоторых частных случаев.

3. В общем случае нет метода, позволяющего определить R и u в

аналитическом виде. Для решения же задач численными методами требуется объем вычислений, затруднительный даже для современных ЦВМ.

265