Материал: 6251

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

−	∂R	= min{r(x(t),u(t),t)+ < grad R ,f >}.		(4.4.9)
	∂t	u(t)	x
			x

Введя обозначение p = gradx R для обобщённого вектора количества движения и H(x,u,p,t)=<p,f > +r для функции Гамильтона, выражение (4.4.9) превратим в уравнение

−∂R = min H(x,u,p,t).

∂t u(t )

Подставив в полученное уравнение оптимальное управление u (t)и оптимальную траекторию x (t), получим классическое уравнение Гамильтона−Якоби

−∂R = H(x ,u ,p,t),

∂t

дополненное условием

min{r(x(t),u(t),t)+ < grad R ,f >}.

(4.4.10)

u(t)	x

Условие (4.4.10) обеспечивается, если приравнять нулю производную по u от выражения в фигурных скобках

grad	u	r+ < grad	x	R ,f >= 0 .	(4.4.11)
	u		x

Итак, в случае непрерывных систем с уравнениями объекта

261

xɺ = f(x,u)

и интегральным критерием

t f

R = ∫r(x,u,t)dt

принцип динамического программирования приводит к уравнению Беллмана

r(x ,u ,t)+ ∂∂R + < gradx R ,f >= 0 , t

где R = min R , а u и x - оптимальное управление и оптимальная траектория движения объекта соответственно, дополненное уравнением (4.4.11) относительно R .

В простейшем случае, когда имеется система первого порядка и ска-

лярное управление, уравнение объекта имеет вид							x = f (x,u). Уравнение
							ɺ
Беллмана в этом случае будет
r(x ,u ,t)+			∂R	+ ∂R		f = 0 ,	(4.4.12)
			∂t	∂ x
а необходимое условие минимума критерия
	∂ r	+	∂ f	∂ R	= 0 .
		+	∂ f	∂ x	= 0 .
	∂u		∂u	∂ x
262

Решая последнее уравнение относительно						∂R	, получим
						∂ x
				∂ r
	∂R
	∂R	= −		∂u	= P(x,u).		(4.4.13)
	∂ x	= −	∂ f		= P(x,u).		(4.4.13)
	∂ x		∂ f

∂u

Подставляя выражение (4.4.13) в уравнение (4.4.12) и решая послед-

нее относительно ∂R , получим

∂t

			∂ r
∂R
∂R	= −r + f		∂u	= Q(x,u).	(4.4.14)
∂t	= −r + f	∂ f		= Q(x,u).	(4.4.14)
∂t		∂ f

∂u

Продифференцируем уравнение (4.4.13) по t, а уравнение (4.4.14) – по x

∂2 R

∂x∂t

∂2 R

∂x∂t

=	∂P	∂u +	∂P	d x	,

	∂u	∂t	∂ x d t
=	∂Q + ∂Q ∂u .
	∂ x	∂u	∂ x

Приравняв правые части полученных выражений, получим уравнение относительно оптимального управления

∂P	∂u + f	∂P	=	∂Q	+	∂Q	∂u	,

∂u	∂t	∂ x		∂ x		∂u	∂ x

263

где P и Q определяются выражениями (4.4.13) и (4.4.14) соответственно.

Пример 4.4.2. Рассмотрим тот же линейный объект, что и в примере 4.3.1. Уравнение объекта

xɺ = −ax + γu ,

где а и γ – некоторые положительные константы. Критерий качества – квадратичный

I(u)= t∫f x2 (u,t)dt ,

а управление ограничено			u	≤ M .		t f
Введём функцию R (x,t)= min						t f
Введём функцию R (x,t)= min						∫x2dt
					u	t
						t
−	∂R				∂R		=
−	∂t	= min r(x,u)+			∂ x	f	=
	∂t	u			∂ x

. Тогда из формулы (4.4.9) следует

min x2	+ ∂R	(− ax + γu) .
	∂ x
u	∂ x

Из выражения в фигурных скобках видно, что его минимум будет в

том случае, если знак управления противоположен знаку ∂R , а абсо-

∂ x

лютное значение – максимально, то есть если

u= −M sign ∂R .

∂x

264

Оптимальное управление, таким образом, будет релейным u = ±M в

соответствии со знаком функции ∂R , удовлетворяющей нелинейному

∂ x

дифференциальному уравнению в частных производных

−	∂R	= x2 − ax	∂R	− γ M	∂R
	∂t		∂ x		∂ x

с граничными условиями x(t0 )= x0 ;R (x,t f )= 0 .

Как видно, сравнительно легко устанавливается общий характер оптимального управления, однако определение линии переключения – отнюдь не простая задача. Аналитическое решение подобного рода задач возможно только в исключительных случаях и приходится прибегать к численным методам.

Сформулируем некоторые выводы.

1.Метод динамического программирования приводит к необходимости решения уравнения Беллмана или Гамильтона−Якоби.

2.Для решения уравнений Гамильтона−Якоби можно воспользоваться методами, описанными в стандартных учебниках классической механики и курсах прикладной математики для некоторых частных случаев.

3. В общем случае нет метода, позволяющего определить R и u в

аналитическом виде. Для решения же задач численными методами требуется объем вычислений, затруднительный даже для современных ЦВМ.

265

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_11_А. Франс для эл версии
_индив анализ данных
- Интерфейс 485 и оптопорт 11