Материал: Стохастические дифференциальные уравнения и диффузионные процессы

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

346ГЛ. VI. ТЕОРЕМЫ СРАВНЕНИЯ И АППРОКСИМАЦИИ

IIIа г 3. Обратимся к доказательству второго утверждения. Пред­ полагаем, лто выполняется условие потраекторной единственности

решений для одного из уравнений (1.9), скажем,

для

i =

1.

Пусть

Х(<) — решение уравнения

 

 

 

 

 

 

 

 

 

| dX (t) = о (t, X (£)) dB (t) +

6j (t, X (£)) dt,

 

 

 

U ( 0 ) - B ( 0 ) .

 

 

 

 

 

 

 

 

(U 0 )

Для e > 0 пусть X^'^t) — решения уравнений

 

 

 

 

I dX (t) =

a (t, X (t)) dB (t) + (bt {t,X (t)) ±

e) * ,

 

 

I X(0) =

x1(0)

 

 

 

 

 

 

 

 

 

 

соответственно. Из уже доказанного следует, что

 

 

 

 

Х (-с) (f)<IX (t)^LXl~R(t)

для всякого

 

О,

 

 

и если 0 < е2 < е„ то

 

 

 

 

 

 

 

 

 

 

 

Х ( EI) ( £ ) < X (

S’^(£) и X^+t* '(£)<[ Х^+е^ (£)

для

всякого

t~^ 0.

Следовательно,

в

силу

непрерывности

Ъ1 (£, х)

и потраекторной

единственности решений для (1.10), имеем

 

 

 

 

 

Н т Х (_£>(/) =

lim X (4t)(/) =

X(t)

для

всякого

£ ^ 0 .

 

e i o

 

 

e i o

 

 

 

 

 

 

 

 

 

 

Применив то', что уже доказано для x,(t)

и Х <+е) (/) получаем

 

 

x1

(t)^ .X {

е) (t)

для

всякого

£:>(),

 

 

(1.11)

поскольку [},(£)<&,(£, Xi(t)) н.н. и

bt(t, x ) < b t(t,

аг) + е. Следова­

тельно, устремляя е I 0 в

(1.11), получаем

 

 

 

 

 

 

Xi{t)^X(t)

для

всякого

t > 0.

 

 

 

(1.12)

Так как $z(t)>b2 (t,

xz(t)) н.н. и

bz(t,

x ) > b t(t,

х )—е,

то

имеем

Х (_8) (t) < xz(t). Устремляя е(0, получаем, что

 

 

 

 

 

 

X (t )^ x z(t)

для всякого

t > 0.

 

 

 

 

Комбинируя ото неравенство с

(1.12), получаем неравенство

 

* . ( 0 < Х ( £ ) < Х 2(0

для всякого

О,

 

 

 

чем и завершается доказательство второго утверждения.

§ 2. Применение к задаче оптимального управления

В качестве применения теоремы сравнения из предыдущего па­ раграфа рассмотрим следующую задачу стохастической оптимизации.

Пусть к (г) — неубывающая и неотрицательная функция, опре­ деленная на [0, °о). Пусть (Bt, и,) — система случайных процессов, определенных на вероятностном пространстве (Q, SF, Р) с потоком ({Ft), такая, что

 

§ 2. ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

 

347

(I)

Bt (Ва= 0 )— d-мериое (^"i)-броуновское

движение

и

, . ( « )

и, — с?-мерный (# ”()-вполне измеримый процесс такой,

что

1м( I < 1

для всех t

0 п. н.

системой

или

Такая система

(Bt, ut) называется допустимой

допустимым управлением. Пусть i e R d задано и фиксировано. Для

заданпой допустимой системы

риск

Х “ определяется

равенством

 

 

г

 

Х“ = я +

Bt +

*jusds-

(2.1)

 

 

о

 

Задача оптимизации состоит в минимизации математического ожи­

дания д ( * ( | х П ) )

по

всем возможным

допустимым системам. Ре­

шение дается следующим образом.

 

 

 

 

Пусть U(у) определяется равенством

 

 

 

 

U(y) =

у/\у 1

у е

Rd\{0},

(2 .2)

 

J =

0 G R".

 

 

 

 

о,

 

 

Рассмотрим следующее

стохастическое

дифференциальное урав­

нение:

( dXt = dB1+

U (Xt)dt,

 

 

 

 

 

 

1 Х . - х .

 

 

 

<2-3>

Из следствия теоремы IV—4.2 мы знаем, что

решение

(X?, B°t)

существует и единственно. Положим

 

 

 

 

 

 

 

и?1 = U (X j).

 

 

(2.4)

Тогда допустимая

система

(#?, и?)

задаетоптимальное

управле­

ние, т. е. для любой допустимой системы

(В,, и,)

имеем

 

 

2 ф (| Х ';| ))< £ (/с (| Х ? | )).

 

(2.5)

Докажем этот факт в качестве простого следствия теоремы 1.1. Первоначально этот результат был получен Бенешем [3] с ис­

пользованием другого метода.

допустимая

Т е о р е м а 2.1. Пусть (В,, и ,)— любая заданная

система и для заданного x e R 4 пусть решение {Х<‘ )

определяется

равенством (2.1). Тогда па подходящем вероятностном пространстве можно построить В?-значные процессы ( Х“} и (Х[*) такие, что

(I){ x n S i x r i ,

(II){ХП 2 (ХП,

(Hi) \xnt \^ |X? |для всякого t ^ 0, п. н.

С л е д с т в и е . Пусть W d = C([0, <»)-<-Rd) и F(u>)неотрица­ тельная борелевская функция на Wd со следующим свойством:

348

ГЛ. VI. ТЕОРЕМЫ СРАВНЕНИЯ II АППРОКСИМАЦИИ

если wt, W d и |м>, (i)l < lw2(01 для всякого

t > 0, то F(wt)< F (w z). (2.6)

Тогда для любой допустимой системы (Bt, ut) имеем

£(F(X?))<£(F(X“)). (2.7)

Иначе говоря, решение (X?] уравнения (2.3) оптимально в смысле минимизации математического ожидания F(XU.).

Заметим, что в частном случае F(u>) = A;(|u>(l)l)

свойство (2.6)

удовлетворяется очевидным образом.

мы

сформулируем сначала

Для того, чтобы доказать теорему

следующую лемму.

 

 

d-мерных

непрерывных

Л е м м а 2.1. Пусть (Х „ Bt) — пара

^-согласованных процессов, определенных на вероятностном про­

странстве (Q, FF, Р) с потоком

(#",),

г^е Ш/) — d-мерное броунов­

ское движение с В» —0. Пусть

(Y t,B t)

— подобная

пара, опреде­

ленная на другом пространстве

(Q', FF', Р')

с потоком

<). Тогда

можно построить вероятностное пространство (Q, 9~, Р)

с потоком

(@~t) и тройку (Х(, У(, Bt) d-мерных (9~,)-согласованных процес­ сов таких, что

(I)(Xt,B t)& (X t,B t),

(II)(У (, B't) t t ( Y t,B t),

(III){В,) d-мерное (&~t)-броуновское движение.

Доказательство получается

точно

также, как в

теореме IV-1.1.

Д о к а з а т е л ь с т в о

т е о р е м ы

 

2.1. Пусть (В,,

ut) — задаппая

допустимая система и Х “ — х + Bt +

J u„ds — соответствующее ре­

шение. Пусть

(X?, В1) — решение уравнения (2.3). Выберем 0(d)-

значную борелевскую функцию (рц(х)) такую, что

 

 

\х>;\х\,

х =

1 ,х 2, . . . , х а ^

0 ,

ЛН*> = 1 * .

^ =

 

 

(2.8)

Положим Bt =

j"i p (X “)dBs иB] =

ft p(X°)dB°. Тогда имеем

 

о

 

 

о

 

 

 

ХГ = х + j V

, ( X ? ) d « . +

(2.9)

 

 

о

 

 

 

 

 

X? - x+

J p -i (X°) dB°s + jU ( X°s).ds.

(2.10)

 

 

0

 

 

0

 

§ 2. ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

349

Применим лемму 2.1 к (Х “, Bt) и (X®, В]). Тогда получаем тропку ( Х “ ,Х?, В,) ( f t ) -согласованных процессов на вероятностном про­

странстве с потоком

(ЗГ,)

таких, что

{B(t)} — d-мерпос (^'^-броу­

новское

движение

и ^

(X?, Bt) £

(£«“ , В,), (X?, Щ £ (X?, %).

Ясно, что существует {ЗГt) -вполне

измеримый d-мерпын

процесс

{и,} такой, что |п,1 <

1 для всякого t >

On

 

 

 

 

*

 

i

 

 

 

=

о

 

+ $usds.

 

 

 

 

 

о

 

Применив формулу

Ито к хх(/) =

|X? |2 и х2 (i) = |Х “ |2,

получаем

dx2. (i) =

2Х Г -/Г1 (X ’/) dBt + 2Xf" -utdt + ddt =

 

=

2|Х'(‘ |dB\ +

[2Х]1.щ + d]dt = 2 V^(T)dB't + [2Х?-и, + d)dt

и

dx1 (t) = 2 X°r p - l (X°i)dBt + 2X°i .U (X ,;)dt + ddt =

= 21X®|dB] + [ -2\X°t \+d]dt = 2V^iJ)dB] + [— 2V7Jt) + d] dt,

где Bt = (Bj,

. .. ,

В!). (Заметим, что \x-p~' (лг)Ь =

S M P-1 (х))ц=

 

 

 

'

 

j

= ^ixjPij ix) =

fiii \x |)-

Положим o(t,

x ) = 2 V x V 0 , £>,(£, x) =

= b2 {t, * ) — 2VxV0 + d,

^ ( 0 = -2 > 'x7 (0 + d и p2(0=2X ,u -ut + d.

Тогда,очевидно,

(i) =

b, (<, x,(t)) и

P2 ( f ) ^

— 2 |X" |+ d =

= 62(£, Xz(t)). Как мы увидим в следующей лемме имеет место мотраекторная единственность решения для стохастического дифферен­ циального уравнения

dX(t) = a(t, X{t))dB{t) + bi(t, X(<))d£ =

 

=

2 (X (t) V 0) indB (t) + [ - 2 (X (0 V 0 )1/2 + d]dt.

(2.11)

Следовательно, можно применить второе утверждение теоремы

2.1

и получить в результате,

что xY(£)<#,(£) для всех £ ^ 0 н.н., т. е.

| |^ |Х “ | для всех ( ^ 0 п.н.

 

 

условие

по-

Л е м м а

2.2. Для уравнения (2.11) выполняется

траекторпой единственности решений.

 

 

макси­

Д о к а з а т е л ь с т в о .

Отметим

сначала, что существуют

мальные п минимальные решения

(2.11); т. е. существуют сильные

решения X, = F|(Xi(0),

В) и X2 = F2(X2(0),

В) уравнения

(2.11)

такие, что,

если

(X(t), B ( t ) ) — любоё решение уравнения (2.11) и

Х,(0) = Х(0) = Х2(0), то X,,(t)<:X(t)^Xz(t)

для всякого t > 0 п.н.

Действительно,

выберем

гладкие

функции

Ь™ (х)

и Ь(„2>(х)

таким

3 5 0

гл. vi. Те о р е м ы с р а в н е н и я и а п п р о к с и м а ц и и

 

образом, что

Ь[х)(х)^Ь[1 )(х )< . . . < Ь (П° ( * ) < . . . < & ( * ) < ...

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim b\P(х) = lim Ь(„2) (х) =

6 (х),

 

 

 

 

 

 

 

 

П-*оо

 

 

П-*о

 

 

 

 

 

 

 

 

где b(x) — bi(t,

x) — —2(x\/0) V2 + d.

Тогда

 

решения

Х„(<)

урав­

нений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

| dX (t) =

o(t, X (<)) dB (*) +

(X (<)) dt,

 

 

 

 

 

\ X(0) =

*

 

 

 

 

 

 

 

 

 

 

удовлетворяют

соотношению

X „ ( f ) ^ X n+,(<),

га =

1, 2,

...,

в

силу

теоремы 1.1. Положим Ь\(х, В) = lim Х„ (•). Диалогичным

образом

 

 

 

 

 

 

 

П—*ЭО

обладают

вышеприведенным

определим Fz(x, В). Ясно, что они

свойством. Положим

 

х

г

V

-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s (х) =

J exp I — j * d z

1dy,

 

х >

0.

 

 

 

 

Тогда s ( 0 + ) > —

если d = l

и s(0+) = —°°, если d > 2 . Рассмотрим

сначала случай d = 1. Согласно формуле Ито,

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

s (X (0) -

s (X (0)) = j s' (X (s)) a (s, X (*)) dB (s)

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

для любого

решения

 

X(t)

уравнения

(2.11)

с Х(0)>0.

Поэтому

E(s(X(t))) = E(s(X(0))). Отсюда заключаем, что Xi(t) = Xz(t)

п.п.

для всех t >

0,

если только

Х,(0) — Х2(0) п. н. Отсюда

следует

по-

траекторная

единственность

 

решений

для

уравнения

(2.11). Если

d > 2, то, как увидим в приводимой ниже теореме 3.1,

inf

Х ( г ) > 0

п. и. для всякого

Т > 0, если только Х ( 0 ) > 0

 

(><<<Т

 

 

 

и. н. Отсюда легко вы­

вести единственность решении для уравнения (2.11); мы оставляем детали доказательства читателю.

Рассмотренная выше оптимизационная задача является частным примером задач стохастического управления. Относительно совре­ менного развития теории стохастического управления мы отсылаем читателя к монографии Крылова [95] *).

*) В частности, в этой книге содержатся важ’ные результаты Крылова об оценках распределения стохастических интегралов, обобщение формулы Итэ и стохастические дифференциальные уравнения с измеримыми коэффициен­ тами.