46
показателя aij решение игры находится на основе максимизации среднего значения
ai , где
n
ai = ∑Pj aij , j =1
с учетом вероятностей всех возможных условий, т.е. выбираем такую стратегию Ai ,
для которой
|
max . |
(3.3) |
ai |
Очевидно, что при использовании показателя rij решение игры находится на основе минимизации среднего риска, т.е.
|
|
|
|
|
|
|
n |
|
|
|
|
min, |
|
|
= ∑Pj rij , |
(3.4) |
|
ri |
ri |
|||||||
|
|
|
|
|
|
|
j=1 |
|
а для показателя fij на основе |
|
|
|
|
|
|||
|
|
|
|
|
|
|
n |
|
|
fi |
max, |
|
fi |
= ∑Pj fij |
(3.5) |
||
j=1
В теории доказывается [7], что та же стратегия, которая обращает в максимум средний выигрыш ai , обращает в минимум и средний риск ri . Там же показано, что при использовании вероятностей состояний применение смешанных стратегий для A не дает ему дополнительных преимуществ, поэтому всегда можно обойтись одними чистыми стратегиями.
Пример 3.1. Рассмотрим больных с подозрением на острый аппендицит. В
зависимости от формы аппендицита будем различать два состояния больных: S1 -
недеструктивный аппендицит (простой), который не дает опасных для жизни осложнений и может пройти без оперативного вмешательства; S2 - деструктивный аппендицит, требующий срочной операции. У хирурга есть две стратегии: A1 -
оперировать, A2 - воздержаться от срочной операции (и наблюдать либо до исчезновения симптомов, либо до появления убедительной картины острого аппендицита). Пусть aij относительное число выздоровевших больных (в процентах)
из всех тех, находившихся в состоянии S j , к которым была применена стратегия Ai .
47
Тогда матрица Ma для этого случая, составленная по реальным данным [8] имеет вид табл. 3.8. Под каждым столбцом этой матрицы приведены значения априорных вероятностей: P1 = P(S1 )= 0,75; P2 = P(S2 )= 0,25 , взятые также из [8].
|
|
|
|
|
|
|
Таблица 3.8 |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ai |
S j |
|
S1 |
S2 |
|
|
|
|
|
||||
|
|
|
|
A1 |
|
|
99,9 |
99,8 |
|
|
|
|
|
|
|
|
|
|
|
A2 |
|
|
100 |
99,3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Pj |
0,75 |
0,25 |
|
|
|
|
|
|
|
|
|
Если подходить к данной матрице с позиций теории игр и не учитывать |
||||||||||||||
вероятности |
P1 и |
P2 , то |
α = β = γ = 99,8 и мы имеем седловую |
точку |
99,8 |
||||||||||
(обведенную в таблице кружком), которая определяет минимаксные стратегии |
A1 и |
||||||||||||||
S2 . Учет априорных вероятностей позволяет рассчитать средние значения |
|||||||||||||||
выигрыша: |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
= 99,9 0,75 +99,8 0,25 = 99,87, |
|
|
|||||||||
|
|
a1 |
|
|
|||||||||||
|
|
|
=100 0,75 +99,3 0,25 = 99,82. |
|
|
||||||||||
|
|
a2 |
|
|
|||||||||||
Из этого расчета следует, что, так как |
|
> |
|
, то применяется стратегия |
A1 . Во всех |
||||||||||
a1 |
a2 |
||||||||||||||
случаях наилучшим признается проведение срочной операции. Этот пример убедительно показывает правильность поведения врача, предпочитающего срочное хирургическое вмешательство консервативному лечению при подозрении на аппендицит.
3.3 Критерии принятия решений в условиях неопределенности
Наличие вероятностей P1 , P2 ,K, Pn хотя бы в вероятностном смысле определяет поведение «природы», однако часто относительно этих вероятностей нельзя сделать никаких предположений. В этом случае для выбора оптимального решения существует несколько подходов, приведенных ниже.
К р и т е р и й Л а п л а с а . |
Согласно этому критерии, называемому также |
|||||||||
«принципом недостаточного основания» |
Лапласа, все состояния S1, S2 ,K, Sn |
|||||||||
считается равновероятными, т.е. P = P =K= P = |
1 |
. В этом случае, используя далее |
||||||||
|
||||||||||
1 |
2 |
n |
n |
|||||||
максимизацию |
|
(или |
|
) или минимизацию |
|
|
согласно выражениям (3.3)-(3.5), |
|||
ai |
fi |
ri |
||||||||
48
которые, конечно, для этого случая упростятся, получим наилучшую чистую стратегию, удовлетворяющую данному критерию.
К р и т е р и й В а л ь д а . Это критерий, согласно которому игрок A выбирает свою минимаксную стратегию, соответствующую его гарантированному выигрышу, равному α. При этом выигрыш будет зависеть от состояний «природы», но не превысит максимина:
α = max minj aij .
i
Это очень осторожная стратегия, рассчитывающая на худший случай. (В играх с активным противником этот худший случай вырабатывается им в качестве противодействия). Критерий Вальда можно применять не только к матрице Ma , но и
к матрице M f . В последнем случае выигрыш игрока A не превышает α* , где
α* = maxi minj fij .
Вслучае, если α ≠ β для матрицы Ma , либо α* ≠ β* для матрицы M f , в этих
матрицах отсутствует седловая точка и игроку более выгодно применять смешанную стратегию. С точки зрения лечебного процесса это означает, что в качестве оптимального решения врачу предлагают применять различные планы лечения с соответствующими вероятностями, а не просто наилучший план. Учитывая, что данная «вычисленная» информация используется врачом в качестве совета, применение смешанных стратегий в данном случае следует считать целесообразным.
Матрица M f размерности 2 ×2 имеет вид табл. 3.9. |
|
|
|
|
Таблица 3.9 |
||||||||||||||
|
Ai |
S j |
S1 |
S2 |
|||||||||||||||
если эта матрица не имеет седловой точки, то |
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
A1 |
f11 |
f12 |
|||||||||||||
оптимальная смешанная стратегия S * |
= (p , p |
2 |
) |
|
|
A |
f |
|
f |
|
|||||||||
|
|
|
|
|
|
|
A |
1 |
|
|
|
21 |
22 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
||
игрока A определяется соотношениями, |
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||
аналогичными (3.1), (3.2). Потому в данном случае |
|
|
|
|
|
|
|||||||||||||
p1 = |
|
f22 |
− f21 |
|
; p2 = |
|
f11 |
− f12 |
, |
|
|
|
|
|
|||||
f11 |
+ f22 |
− f12 − f |
21 |
|
f11 + f22 |
− f12 − f 21 |
|
|
|
|
|
||||||||
откуда |
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
p1 |
|
|
f22 − f21 |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
= |
|
; |
|
|
|
|
|
|
(3.6) |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
p2 |
f11 − f12 |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
49 |
γ = |
f22 f11 − f12 |
f21 |
|
||
|
|
. |
(3.7) |
||
f11 + f22 − f12 |
− f21 |
||||
К р и т е р и й С э в и д ж а . |
Этот критерий рекомендует |
в условиях |
|||
неопределенности выбирать для игрока |
A также минимаксную стратегию, но не по |
||||
матрицам выигрышей Ma или M f , а по матрице риска Mr . Оптимальной считается та стратегия, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален). При этом риск для разных состояний «природы» не превышает значения R , где
R = mini max rij .
j
Критерий Сэвиджа так же, как и предыдущий критерий Вальда, допускает применение смешанной стратегии для игрока A в случае, когда матрица Mr не имеет седловой точки.
3.4Принятие решений при острых хирургический заболеваниях органов брюшной полости
Целесообразность применения теории игр для оптимизации принятия решения о проведении хирургических операций при “остром животе”, остром аппендиците, остром холецистите, закрытых травмах, онкологических заболеваниях и др. подробно раскрыта в интересной монографии [8]. Дальнейшее изложение основано на материале этой работы. Специфику применения игровых методов для принятия оптимальных решений в хирургии рассмотрим на примере клинической ситуации подозрения на “острый живот”, т.е. на острое хирургическое заболевание органов брюшной полости и на примере онкологических заболеваний.
При “остром животе” у хирурга есть только две стратегия: A1 - срочное оперативное вмешательство и A2 - отказ от срочной операции с последующим принятием нового решения. Состояния больного формулируются в соответствии с возможными управляющими воздействиями, т. е. стратегиями хирурга, следующим образом:
S1 - острое заболевание органов брюшной полости, при котором показана срочная операция;
50
S2 - острое за6олевание при котором может оказаться более выгодной отсроченная операция после подготовки;
S3 - острое заболевание органов брюшной полости или иной локализации,
симулирующее S1 или S2 , при котором оперативное вмешательство окажется напрасным;
S4 -острое заболевание, симулирующее S1 или S2 , при котором операция противопоказана (в дальнейшем это состояние имеет также обозначение S2* ).
Главными равноправными целями хирурга являются максимизация величины вероятности выживания больного и минимизации величины вероятности неоправданных потерь (минимизация риска).
Пусть cij - вероятность летального (смертельного) исхода при применений хирургом стратегии Ai к больному, находящемуся в состоянии S j . Тогда можно составить матрицу летальности Mc с элементами cij , которая имеет вид табл.3.10.
Анализ величин элементов этой матрицы показывает, что всегда выполняются соотношения: g > l, h > d, t < d, t < l, t < b, которые наглядно можно представить в виде схемы
g → l
t ← b ,
h → d
показывающий, что вероятность летального исхода срочной операции является минимальной в случае S3 . По матрице Mc построим матрицу выигрышей Ma ,
подразумевая под выигрышем aij вероятность выздоровления больного
(благоприятного исхода), находящегося в состоянии S j , к которому применяется стратегия Ai . Для построения Ma воспользуемся очевидным соотношением aij =1 −cij . Тогда Ma будет иметь вид табл.3.11.
|
|
|
|
|
Таблица 3.10 |
|
Ai |
S j |
S1 |
S2 |
S3 |
|
S4 |
|
A1 |
l |
h |
t |
|
b |
|
A2 |
g |
d |
0 |
|
0 |
|
|
|
|
|
|
|