Находим
точку оптимума – О. В этой точке
пересекаются стратегии
игру 2
2
с платежной матрицей вида:

Используя алгебраический метод решения этой игры, получаем точное решение:



Ответ:
оптимальные смешанные стратегии игроков
при цене игры

В игре mx2 мы имеем две m стратегий (A1, A2, …, Аm), а наш противник 2 стратегии (B1, B2). В игре mx2 всегда имеется решение, содержащее не более двух активных стратегий у каждого из игроков, если эти активные стратегии игроков будут найдены, то игры mx2 превращаются в игры 2x2 (описано в вопросе 18).
Правила решения игр mx2:
строится графическое изображение игры;
выделяется верхняя граница выигрыша, и на ней находится точка оптимума с наибольшей ординатой;
определяется пара стратегий, пересекающихся в точке оптимума M. Эти стратегии являются активными стратегиями игрока B. Если в точке оптимума пересекаются более двух стратегий, то в качестве активных стратегий может быть выбрана любая пара из них;
решается полученная игра 2x2.
Пример:
Дана матрица стратегий

Решение:
|
|
B1 |
B2 |
αi |
|
A1 |
0,4 |
1,0 |
0,4 |
|
A2 |
0,5 |
0,5 |
0,5 |
|
A3 |
1,0 |
0,3 |
0,3 |
|
A4 |
0,8 |
0,3 |
0,3 |
|
βj |
1,0 |
1,0 |
|
α= 0,5, β= 1,0. Седловой точки нет.
1. Cтроим графическое изображение игры относительно игрока В.
Если А применяет А1, то при использовании игроком В стратегии В1 выигрыш игрока А равен 0,4, а выигрыш А при стратегии В2 равен 1,0, поэтому на перпендикулярах строим такие отрезки. Видно, что стратегия А4 заведомо невыгодная по сравнению со стратегией А3 (выигрыш меньше).
2. Выделяем верхнюю границу выигрыша А3NА1′; точка с наименьшей ординатой – N.
3.
В этой точке пересекаются отрезки А1А1′
и А3А3′, соответствующие активным
стратегиям А1 и А3. Стратегия А2 не является
активной, поэтому из матрицы исключаем
вторую и четвертую строки:
![]()

4. решаем игру:

13p3 = 6; p3 = 6/13; p1 = 7/13

q2 = 6/13.
Ответ: γ = 44/65; PA = (7/13; 0; 6/13; 0); QB = (7/13; 6/13).
(γ – стоимость игры)
Примечание: Игроку А не выгодно отклоняться от спектра своих активных стратегий.
Для игр m × n геометрическая интерпретация неприменима. Здесь применяются чисто расчетные методы. Можно показать, что решение любой конечной игры m × n может быть сведено к задаче линейного программирования.
Рассмотрим
игру m
× n.
У игрока A
имеется m
стратегий: A1,
A2,
..., Am;
у игрока B
есть n
стратегий: B1,
B2,
..., Bn.
Такая игра задается матрицей игры m
× n
[aij].
Нужно найти две оптимальные смешанные
стратегии S*A
= (p1,
p2,
..., pm)
и S*B
= (q1,
q2,
..., qn),
где p1,
p2,
..., pm
и q1,
q2,
..., qn
– вероятности применения соответствующих
чистых стратегий A1,
A2,
..., Am
и B1,
B2,
..., Bn
и
,
.
Нахождение S*A. Положим, что цена игры γ положительна, γ ≥ 0. Это всегда можно сделать, добавив ко всем членам матрицы игры достаточно большое положительное число М. При этом решение игры не изменится, а найденную величину γ нужно будет в конце также увеличить на М.
Если мы применяем S*A, а противник – чистую стратегию B j, то наш средний выигрыш будет равен
![]()

Так как мы применяем S*A, то наш средний выигрыш не может быть меньше цены игры γ, т. е. a j ≥ γ, j = 1, 2, ..., n, поэтому
(1)

Строки вышеприведенной системы пишутся по столбцам матрицы игры.
Разделим все вышеприведенные неравенства на положительную величину γ и введем обозначения
![]()
Тогда система (1) превращается в следующую:
(2)
Так как p1 + p2 + ... + pm = 1, то

Мы хотим сделать наш гарантированный выигрыш максимально возможным. При этом величина 1/ γ принимает минимальное значение.
Таким образом мы получаем следующую задачу линейного программирования: найти такие неотрицательные значения переменных x1, x2, ..., xm, которые удовлетворяли бы линейным ограничениям (2) и обращали бы в минимум линейную функцию
![]()
Решив эту задачу линейного программирования, мы можем найти оптимальную стратегию S*A игрока A.
Нахождение
SB*.
Оптимальная
стратегия
SB*
находится
аналогично.
Разница
заключается в том, что игрок B
стремится не максимизировать, а
минимизировать выигрыш, а значит
максимизировать величину 1
γ.
Следовательно,
вместо условий (2)
должны соблюдаться условия
(3)
Требуется так выбрать неотрицательные значения переменных y1, y 2, ..., yn, чтобы они удовлетворяли условиям (3.14) и обращали в максимум линейную функцию
L
=
y1
+
y
2
+
...
+
yn
=
1
γ
или, что то же самое, обращали в минимум линейную функцию L′ = −L:
L
′
=
−
y1
−
y
2
−
...
−
yn
=
−
1
γ.
Таким образом, любая конечная игра m × n сводится к паре задач линейного программирования.