Материал: Методичка

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

16

x11

+ x31

=1,

 

x22

+ x32

=1,

(1.17)

x13

=1,

 

 

3x22 +10x13 + 6x32

15 ,

1,5x22

+ 6x31 + 3x32

8 ,

18x11

+1,5x22 + 6x31 19 .

Последнюю систему неравенств преобразуем в систему равенств, введя новые неотрицательные переменные y1 , y2 , y3 .

y1 =15 3x22 10x13 6x32 ,

 

y2

=8 1,5x22

6x31 3x32 ,

(1.18)

y3

=19 18x11

1,5x22 6x31 .

 

Таким образом, (1.17) и (1.18) образуют систему из 6 уравнений с 8

неизвестными: x11 , x31 , x22 , x32 , x13 , y1 , y2 , y3 . Применим геометрический способ решения. Выберем 2 свободных переменных x31 и x32 . Остальные 6 будут базисными. Выразим базисные переменные через свободные

 

 

x11 =1 x31 , y1 = 2 3x32 ,

 

 

 

 

x22

=1 x32 ,

y2

= 6,5 6x31 1,5x32 ,

 

 

 

x13

=1,

 

y3

= −0,5 +12x31

+1,5x32

 

Из

условия

неотрицательности

 

базисных

переменных

получаем

 

 

x31 1,

x32

≤ −4x31 + 4,33;

 

 

 

 

x32

1,

x32

0,3 8x31 ;

 

 

 

 

x32

0,66 .

 

 

 

 

Графически эти условия изображены на рис.1.4.

 

 

Функция цели, выраженная через свободные переменные, равна

 

 

L = 0,82 + 0,12x31 + 0,06x32 ,

 

 

 

 

 

 

L' = L 0,82 = 0,12x31 + 0,06x32

 

 

 

 

и основная прямая L' = 0 имеет вид x32

= −2x31 . Из рис.1.4 видно, что максимум L' и

L достигается в точке F . Таким образом, решение задачи:

 

 

 

17

x31

= 0,92;

x22

= 0,34;

x32

= 0,66;

x13

=1;

x11 = 0,08;

L = 0,82 + 0,12 0,92 + 0,06 0,66 = 0,97

Следовательно, при выбранной оптимальной схеме лечения относительное число выздоровевших больных максимально и составляет 97%.

x32 x32=-4x31+4,33

1,0

 

 

0,66

F

 

 

ОДР

L’=max

 

 

L’=0

 

 

 

 

x31

 

0,92

1,0

x32=-8x31+0,5

Рис.1.4

2. УПРАВЛЕНИЕ СОСТОЯНИЕМ ОРГАНИЗМА В БИОТЕХНИЧЕСКИХ СИСТЕМАХ НА ОСНОВЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

2.1. Метод динамического программирования

Рассмотрим управляемый процесс, который переводит некоторую систему G

из начального состояния S0 в конечное состояние Sm . При наличии промежуточных состояний такой перевод представляется в виде траектории, состоящей из

18

конкретной последовательности промежуточных состояний (рис.2.1). Если промежуточные состояния могут быть различными, то траектория перевода G из S0

в Sm неоднозначна и зависит от вырабатываемых управляющих воздействий x .

Введя какую-либо целевую функцию W =W (x), зависящую от выбранного управления x , можно сравнивать (по величине W ) траектории друг с другом и ставить задачу об отыскании оптимальной траектории, при которой достигается экстремум W . В зависимости от содержания целевой функции в процессе

оптимизации

ее

стремятся

либо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W(x')

 

максимизировать, либо минимизировать. Мы

 

 

 

 

 

 

x

'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sm

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

далее будем рассматривать оптимизацию,

S0

 

 

 

 

 

 

 

x''

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W(x'')

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при которой

W min .

Таким

образом,

 

 

 

 

 

 

 

 

 

 

x*

 

 

 

 

 

 

 

 

 

 

 

 

 

W*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

задача

заключается

в

отыскании

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x'''

 

 

 

 

 

 

 

 

 

 

 

 

 

W(x''')

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оптимального управления

x *,

при котором

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

целевая

функция

W достигает

своего

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис.2.1

 

минимального значения W * , т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W* = min{W (x)}.

x

Представим себе теперь процесс управления состоящим из конечного числа последовательных шагов. В этом случае траектория перехода G из S0 в Sm будет иметь вид последовательности промежуточных состояний S0 , S1 , S2 ,K, Sm , которая является результатом пошагового управления x , также имеющего вид последовательности x = x1 , x2 ,K, xm . Будет считать, что Si обозначает состояние системы G , а xi - управление на i-м шаге для произвольной траектории. Для конкретной же траектории конкретное управление xi' переводит G в конкретное состояние Si' . Нужно иметь в виду, что управления x1 , x2 ,K, xm в общем случае не числа, а вектора, функции, какие-либо предписания и т.п. Пусть на каждом отдельном i-м шаге, заключающемся в переходе из Si1 в Si , известно значение целевой функции W которое обозначается wi . Считая выбранный критерий W

аддитивным, т.е. полагая, что

19

m

W= wi ,

i=1

задача оптимизации формулируется следующим образом. Требуется найти такое оптимальное управление x* = x1 , x2 ,K, xm (где xi - оптимальное шаговое управление на i-м шаге), при котором целевая функция W принимает минимальное значение, т.е.

 

 

m

 

 

 

 

 

 

 

 

 

 

 

W = wi min .

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

Последовательность оптимальный

шаговых

управлений x , x ,K, x

приводит к

 

 

 

 

 

 

 

1 2

 

 

m

 

оптимальной траектории S

0

, S * , S *

,K, S *

, S

m

перевода G из S

0

в S

m

.

 

 

1 2

 

m1

 

 

 

 

 

Для примера, приведенного на рис.2.2, существует два варианта управлений и две возможных траектории, для каждой из которых можно подсчитать значение целевой функции.

 

 

I вариант

 

II вариант

 

Управление:

x'= x1' , x2' , x3'

, x4

 

x''= x1'' , x2'' , x3'' , x4

 

 

Траектория:

S0 , S1' , S2' , S3 , S4

 

S0 , S1'' , S2'' , S3 , S4

 

 

Целевая функция:

W '= w'

+ w'

+ w'

+ w

W ''= w'' + w''

+ w''

+ w

 

 

4

 

1

2

3

4

1

2

3

 

Пусть W '>W '' ; тогда второй вариант является оптимальным, т.е. x* = x'', W* =W '' .

Поиск

оптимального

управления

x *

 

методом

динамического

 

 

 

S '

 

 

 

 

 

'

w2'

2 w3'

S3

 

 

 

 

S1

 

 

w4

 

 

 

 

 

 

 

S4

 

 

 

 

 

 

 

 

 

w'

 

w''

 

 

 

 

 

1

 

 

 

 

 

 

S0

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2''

 

 

 

 

 

w''

 

w''

 

 

 

 

 

1

 

2

 

 

 

 

S1''

Рис. 2.2

20

программирования основан на использовании общего принципа, известного как принцип оптимальности. Он формулируется так [7]:

Каково бы ни было состояние S системы G в результате какого-то числа шагов, мы должны выбирать управление на ближайшем шаге так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к минимальному значению целевой функции на всех оставшихся шагах, включая данный.

При решении задач динамического программирования полезно пользоваться схемой решения, данной в [6,7]. После выбора способа описания состояний управляемой системы и разбиения всего процесса управления на шаги применяется следующая процедура [7].

1. Перечислить набор шаговых управлений xi для каждого шага и налагаемые на них ограничения.

2. Для каждого i-го шага определить значение wi в функции от состояния Si1

на (i 1)-м шаге и от шагового управления xi

wi = fi (Si1 , xi ).

 

3. Определить, как изменяется состояние Si1 системы G

под влиянием

управления xi на i-м шаге: оно переходит в новое состояние

 

Si i (Si1 , xi )

(2.1)

4. Пусть Wi (Si1 ) - условный оптимум целевой функции, получаемый на всех последующих шагах, начиная с i-го и до конца. Надо записать основное рекуррентное уравнение динамического программирования, выражающее Wi (Si1 )

через уже известную функцию Wi+1 (Si )

 

Wi (Si1 )= min{fi (Si1 , xi )+Wi+1 (ϕi (Si1 , xi ))}.

(2.2)

xi

 

Этому условному оптимуму целевой функции соответствует условное оптимальное управление на i-м шаге xi (Si1 ), которое совместно с оптимальным управлением на всех последующих шагах обращает целевую функцию на всех оставшихся шагах, начиная с данного, в минимум.