Материал: Стохастические дифференциальные уравнения и диффузионные процессы

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

346ГЛ. VI. ТЕОРЕМЫ СРАВНЕНИЯ И АППРОКСИМАЦИИ

IIIа г 3. Обратимся к доказательству второго утверждения. Пред полагаем, лто выполняется условие потраекторной единственности

решений для одного из уравнений (1.9), скажем,

для

i =

Пусть

Х(<) — решение уравнения

| dX (t) = о (t, X (£)) dB (t) +

6j (t, X (£)) dt,

U ( 0 ) - B ( 0 ) .

(U 0 )

Для e > 0 пусть X^'^t) — решения уравнений

I dX (t) =

a (t, X (t)) dB (t) + (bt {t,X (t)) ±

e) * ,

I X(0) =

x1(0)

соответственно. Из уже доказанного следует, что

Х (-с) (f)<IX (t)^LXl~R(t)

для всякого

О,

и если 0 < е2 < е„ то

Х ( EI) ( £ ) < X (

S’^(£) и X^+t* '(£)<[ Х^+е^ (£)

для

всякого

t~^ 0.

Следовательно,

силу

непрерывности

Ъ1 (£, х)

и потраекторной

единственности решений для (1.10), имеем

Н т Х (_£>(/) =

lim X (4t)(/) =

X(t)

для

всякого

£ ^ 0 .

e i o

Применив то', что уже доказано для x,(t)

и Х <+е) (/) получаем

(t)^ .X {

е) (t)

для

всякого

£:>(),

(1.11)

поскольку [},(£)<&,(£, Xi(t)) н.н. и

bt(t, x ) < b t(t,

аг) + е. Следова

тельно, устремляя е I 0 в

(1.11), получаем

Xi{t)^X(t)

для

всякого

t > 0.

(1.12)

Так как $z(t)>b2 (t,

xz(t)) н.н. и

bz(t,

x ) > b t(t,

х )—е,

то

имеем

Х (_8) (t) < xz(t). Устремляя е(0, получаем, что

X (t )^ x z(t)

для всякого

t > 0.

Комбинируя ото неравенство с

(1.12), получаем неравенство

* . ( 0 < Х ( £ ) < Х 2(0

для всякого

О,

чем и завершается доказательство второго утверждения.

§ 2. Применение к задаче оптимального управления

В качестве применения теоремы сравнения из предыдущего па раграфа рассмотрим следующую задачу стохастической оптимизации.

Пусть к (г) — неубывающая и неотрицательная функция, опре деленная на [0, °о). Пусть (Bt, и,) — система случайных процессов, определенных на вероятностном пространстве (Q, SF, Р) с потоком ({Ft), такая, что

	§ 2. ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ			347
(I)	Bt (Ва= 0 )— d-мериое (^"i)-броуновское		движение	и
, . ( « )	и, — с?-мерный (# ”()-вполне измеримый процесс такой,			что
1м( I < 1	для всех t	0 п. н.	системой	или
Такая система		(Bt, ut) называется допустимой

допустимым управлением. Пусть i e R d задано и фиксировано. Для

заданпой допустимой системы	риск	Х “ определяется	равенством
		г
Х“ = я +	Bt +	*jusds-	(2.1)
		о

Задача оптимизации состоит в минимизации математического ожи

дания д ( * ( \| х П ) )	по	всем возможным			допустимым системам. Ре
шение дается следующим образом.
Пусть U(у) определяется равенством
	U(y) =		— у/\у 1	у е	Rd\{0},		(2 .2)
				J =	0 G R".
			о,
Рассмотрим следующее		стохастическое			дифференциальное урав
нение:	( dXt = dB1+			U (Xt)dt,

	1 Х . - х .						<2-3>
Из следствия теоремы IV—4.2 мы знаем, что						решение	(X?, B°t)
существует и единственно. Положим
			и?1 = U (X j).				(2.4)
Тогда допустимая	система		(#?, и?)	задаетоптимальное			управле
ние, т. е. для любой допустимой системы					(В,, и,)	имеем
	2 ф (\| Х ';\| ))< £ (/с (\| Х ? \| )).						(2.5)

Докажем этот факт в качестве простого следствия теоремы 1.1. Первоначально этот результат был получен Бенешем [3] с ис

пользованием другого метода.	допустимая
Т е о р е м а 2.1. Пусть (В,, и ,)— любая заданная	допустимая
система и для заданного x e R 4 пусть решение {Х<‘ )	определяется

равенством (2.1). Тогда па подходящем вероятностном пространстве можно построить В?-значные процессы ( Х“} и (Х[*) такие, что

(I){ x n S i x r i ,

(II){ХП 2 (ХП,

(Hi) \xnt \^ |X? |для всякого t ^ 0, п. н.

С л е д с т в и е . Пусть W d = C([0, <»)-<-Rd) и F(u>)— неотрица тельная борелевская функция на Wd со следующим свойством:

348	ГЛ. VI. ТЕОРЕМЫ СРАВНЕНИЯ II АППРОКСИМАЦИИ

если wt, W d и |м>, (i)l < lw2(01 для всякого

t > 0, то F(wt)< F (w z). (2.6)

Тогда для любой допустимой системы (Bt, ut) имеем

£(F(X?))<£(F(X“)). (2.7)

Иначе говоря, решение (X?] уравнения (2.3) оптимально в смысле минимизации математического ожидания F(XU.).


Заметим, что в частном случае F(u>) = A;(\|u>(l)l)					свойство (2.6)
удовлетворяется очевидным образом.		мы		сформулируем сначала
Для того, чтобы доказать теорему
следующую лемму.			d-мерных		непрерывных
Л е м м а 2.1. Пусть (Х „ Bt) — пара
^-согласованных процессов, определенных на вероятностном про
странстве (Q, FF, Р) с потоком	(#",),	г^е Ш/) — d-мерное броунов
ское движение с В» —0. Пусть	(Y t,B t)		— подобная		пара, опреде
ленная на другом пространстве	(Q', FF', Р')			с потоком		<). Тогда
можно построить вероятностное пространство (Q, 9~, Р)						с потоком

(@~t) и тройку (Х(, У(, Bt) d-мерных (9~,)-согласованных процес сов таких, что

(I)(Xt,B t)& (X t,B t),

(II)(У (, B't) t t ( Y t,B t),

(III){В,) — d-мерное (&~t)-броуновское движение.

Доказательство получается			точно		также, как в	теореме IV-1.1.
Д о к а з а т е л ь с т в о		т е о р е м ы			2.1. Пусть (В,,	ut) — задаппая
допустимая система и Х “ — х + Bt +					J u„ds — соответствующее ре
шение. Пусть	(X?, В1) — решение уравнения (2.3). Выберем 0(d)-
значную борелевскую функцию (рц(х)) такую, что
	\х>;\х\,		х =	(х1 ,х 2, . . . , х а ^		0 ,
ЛН> = 1 .			^ =			(2.8)
Положим Bt =	j"i p (X “)dBs иB] =			ft p(X°)dB°. Тогда имеем
	о			о
	ХГ = х + j V		, ( X ? ) d « . +			(2.9)
		о
	X? - x+	J p -i (X°) dB°s + jU ( X°s).ds.				(2.10)
		0			0

§ 2. ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

349

Применим лемму 2.1 к (Х “, Bt) и (X®, В]). Тогда получаем тропку ( Х “ ,Х?, В,) ( f t ) -согласованных процессов на вероятностном про

странстве с потоком		(ЗГ,)	таких, что		{B(t)} — d-мерпос (^'^-броу
новское	движение	и ^	(X?, Bt) £		(£«“ , В,), (X?, Щ £ (X?, %).
Ясно, что существует {ЗГt) -вполне				измеримый d-мерпын		процесс
{и,} такой, что \|п,1 <		1 для всякого t >			On
			*		i
		=	о		+ $usds.
					о
Применив формулу		Ито к хх(/) =		\|X? \|2 и х2 (i) = \|Х “ \|2,		получаем
dx2. (i) =	2Х Г -/Г1 (X ’/) dBt + 2Xf" -utdt + ddt =
=	2\|Х'(‘ \|dB\ +	[2Х]1.щ + d]dt = 2 V^(T)dB't + [2Х?-и, + d)dt

dx1 (t) = 2 X°r p - l (X°i)dBt + 2X°i .U (X ,;)dt + ddt =

= 21X®|dB] + [ -2\X°t \+d]dt = 2V^iJ)dB] + [— 2V7Jt) + d] dt,

где Bt = (Bj,	. .. ,	В!). (Заметим, что \x-p~' (лг)Ь =			S M P-1 (х))ц=
			'		j
= ^ixjPij ix) =	fiii \x \|)-		Положим o(t,	x ) = 2 V x V 0 , £>,(£, x) =
= b2 {t, * ) — 2VxV0 + d,			^ ( 0 = -2 > 'x7 (0 + d и p2(0=2X ,u -ut + d.
Тогда,очевидно,		(i) =	b, (<, x,(t)) и	P2 ( f ) ^	— 2 \|X" \|+ d =

= 62(£, Xz(t)). Как мы увидим в следующей лемме имеет место мотраекторная единственность решения для стохастического дифферен циального уравнения

dX(t) = a(t, X{t))dB{t) + bi(t, X(<))d£ =


	=	2 (X (t) V 0) indB (t) + [ - 2 (X (0 V 0 )1/2 + d]dt.					(2.11)
Следовательно, можно применить второе утверждение теоремы								2.1
и получить в результате,			что xY(£)<#,(£) для всех £ ^ 0 н.н., т. е.
\| \|^ \|Х “ \| для всех ( ^ 0 п.н.						условие		по-
Л е м м а	2.2. Для уравнения (2.11) выполняется
траекторпой единственности решений.							макси
Д о к а з а т е л ь с т в о .			Отметим	сначала, что существуют
мальные п минимальные решения				(2.11); т. е. существуют сильные
решения X, = F\|(Xi(0),			В) и X2 = F2(X2(0),		В) уравнения		(2.11)
такие, что,	если	(X(t), B ( t ) ) — любоё решение уравнения (2.11) и
Х,(0) = Х(0) = Х2(0), то X,,(t)<:X(t)^Xz(t)					для всякого t > 0 п.н.
Действительно,		выберем	гладкие	функции	Ь™ (х)	и Ь(„2>(х)	таким

3 5 0	гл. vi. Те о р е м ы с р а в н е н и я и а п п р о к с и м а ц и и

образом, что

Ь[х)(х)^Ь[1 )(х )< . . . < Ь (П° ( * ) < . . . < & ( * ) < ...

lim b\P(х) = lim Ь(„2) (х) =

6 (х),

П-*оо

П-*о

где b(x) — bi(t,

x) — —2(x\/0) V2 + d.

Тогда

решения

Х„(<)

урав

нений

| dX (t) =

o(t, X (<)) dB (*) +

(X (<)) dt,

\ X(0) =

удовлетворяют

соотношению

X „ ( f ) ^ X n+,(<),

га =

1, 2,

...,

силу

теоремы 1.1. Положим Ь\(х, В) = lim Х„ (•). Диалогичным

образом

П—*ЭО

обладают

вышеприведенным

определим Fz(x, В). Ясно, что они

свойством. Положим

-1

s (х) =

J exp I — j * d z

1dy,

х >

Тогда s ( 0 + ) > —

если d = l

и s(0+) = —°°, если d > 2 . Рассмотрим

сначала случай d = 1. Согласно формуле Ито,

s (X (0) -

s (X (0)) = j s' (X (s)) a (s, X (*)) dB (s)

для любого

решения

X(t)

уравнения

(2.11)

с Х(0)>0.

Поэтому

E(s(X(t))) = E(s(X(0))). Отсюда заключаем, что Xi(t) = Xz(t)

п.п.

для всех t >

если только

Х,(0) — Х2(0) п. н. Отсюда

следует

по-

траекторная

единственность

решений

для

уравнения

(2.11). Если

d > 2, то, как увидим в приводимой ниже теореме 3.1,

inf

Х ( г ) > 0

п. и. для всякого

Т > 0, если только Х ( 0 ) > 0

(><<<Т

и. н. Отсюда легко вы

вести единственность решении для уравнения (2.11); мы оставляем детали доказательства читателю.

Рассмотренная выше оптимизационная задача является частным примером задач стохастического управления. Относительно совре менного развития теории стохастического управления мы отсылаем читателя к монографии Крылова [95] *).

*) В частности, в этой книге содержатся важ’ные результаты Крылова об оценках распределения стохастических интегралов, обобщение формулы Итэ и стохастические дифференциальные уравнения с измеримыми коэффициен тами.

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_11_А. Франс для эл версии
_3 тема - Диффузия
_индив анализ данных