Материал: Материалы по курсу (часть 2)

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

16. Игры 2х2 и их решение.

Игра 2х2 – самая простая конечная игра, её матрица имеет вид табл. 3.2.

Если для этой матрицы α=β, то игра имеет седловую точку и её решение – это пара чистых стратегий, пересекающихся в седловой точке.

Если в этой матрице седловой точки нет и α≠β, то необходимо искать решение в смешанных стратегиях. Пара оптимальных смешанных стратегий: и цена игры в этом случае определяется по формулам:

17. Геометрическая интерпретация решений игры 2х2.

Решение игры 2х2 допускает наглядную геометрическую интерпретацию.

Пусть игра задана платежной матрицей Р = (а_ij), i, j = 1, 2. По оси абсцисс отложим единичный отрезок А₁А₂; точка A₁(x = 0) изображает стратегию А₁, а все промежуточные точки этого отрезка —смешанные стратегии S_Aпервого игрока, причем расстояние от S_Aдо правого конца отрезка —это вероятностьр₁стратегииА₁, расстояние до левого конца —вероятность p₂стратегии А₂. На перпендикулярных осях I—I и II—II откладываем выигрыши при стратегиях А₁и А₂соответственно. Если 2-й игрок примет стратегию В₁, то она дает выигрыши а₁₁и а₂₁на осях I—I и II—II, соответствующие стратегиям А₁и А₂. Обозначим эти точки на осях I—I и II—II буквой В₁.Средний выигрыш v₁, соответствующий смешанной стратегии S_A, определяется по формуле математического ожидания v₁ = а₁₁р₁ + а₂₁р₂и равен ординате точки М₁, которая лежит на отрезке В₁В₁и имеет абсциссу S_A (рис. 1).

Рис. 1 Рис. 2

Аналогично строим отрезок В₂В₂, соответствующий применению вторым игроком стратегии В₂(рис. 2). При этом средний выигрыш v₂ = а₁₂р₁ + а₂₂р₂— ордината точки М₂.

В соответствии с принципом минимакса оптимальная стратегия S^*_Aтакова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной (рис. 3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке B₁N —против стратегии В₁, на участке NB₂ —против стратегии B₂). Оптимальную стратегию S^*_A = (p^*₁, р^*₂) определяет точка N, в которой минимальный выигрыш достигает максимума; ее ордината равна цене игры v. На рис.3 обозначены также верхняя и нижняя цены игры  и .

Применим геометрический метод для решения следующей задачи.

Рис. 3 Рис. 4

Пример. Решить графически игру, заданную платежной матрицей:

Решение. Откладываем по оси абсцисс (рис. 4) единичный отрезок А₁А₂. На вертикальной оси I—I откладываем отрезки: а₁₁= 1,5, соответствующий стратегии В₁, и а₁₂ = 3, соответствующий стратегии В₂. На вертикальной оси II—II отрезок а₂₁ = 2 соответствует стратегии В₁, отрезок а₂₂ = 1 соответствует стратегии В₂ (см. рис. 4). Нижняя цена игры =а₁₁ = 1,5. Верхняя цена игры  =а₂₁ = 2, седловая точка отсутствует. Из рис. 4 видно, что абсцисса точки N определяет оптимальную стратегию S^*_A, а ордината —цену игры v. Точка N является точкой пересечения прямых В₁В₁и В₂В₂. Уравнение прямой В₁В₁, проходящей через точки (0; 1,5) и (1;2):

Уравнение прямой В₂В₂, проходящей через точки (0; 3) и (1;1):

Точка пересечения прямых является решением системы:

- там знак системы, он не исправляется

или х = 0,6; у = 1,8, т. е. N (0,6; 1,8).

Таким образом, р^*₁ = 0,6, р^*₂ = 1 — 0,6 = 0,4; оптимальная стратегия S^*_A = (0,6; 0,4), цена игры v = 1,8.

Геометрически можно также определить оптимальную стратегию игрока В, если поменять местами игроков А и В и вместо максимума нижней границы А₂МА₁в соответствии с принципом минимакса (рис. 5) рассмотреть минимум верхней границы.

Рис. 5

Абсцисса точки М определяет q^*₂в оптимальной стратегии игрока В, ордината этой точки —цена игры. Прямая А₁А₁, проходящая через точки (0; 1,5) и (1; 3), удовлетворяет уравнению

Прямая А₂А₂, проходящая через точки (0; 2) и (1; 1), удовлетворяет уравнению у =—х +2.

Координаты их точки пересечения М —это решение системы уравнений:

откуда х = 0,2; у = 1,8, т. е. q^*₂ = 0,2, q^*₁ = 1— q^*₂ = 0,8, х =у = 1,8, S^*_B = (0,8; 0,2).

Оптимальное решение игры найдено.

Из решения задачи следует, что геометрически можно определять оптимальную стратегию как игрока А, так и игрока B, в обоих случаях используется принцип минимакса, но во втором случае строится не нижняя, а верхняя граница выигрыша и на ней определяется не максимум, а минимум. Если платежная матрица содержит отрицательные числа, то для графического решения задачи лучше перейти к новой матрице с неотрицательными элементами; для этого к элементам исходной матрицы достаточно добавить соответствующее положительное число. Решение игры при этом не изменится, а цена игры увеличится на это число. В примере выше платежная матрица не имела седловой точки ().

При наличии седловой точки графическое решение дают варианты, изображенные на рис. 6 и 7. На рис. 6 наибольшей ординатой на ломаной B₁NB₂обладает точка B₂, поэтому оптимальной является чистая стратегия А₂для игрока А (В₂ —для игрока В), т.е. оптимальное решение: S^*_A = (0; 1), S^*_B = (0; 1). Игра имеет седловую точкуа₂₂ = v.

Рис. 6 Рис. 7

Чистая стратегия В₂(рис. 7) не выгодна для игрока В, поскольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия В₁. На основании принципа минимакса выделим прямую В₁В₁и на ней точку В₁с наибольшей ординатой на оси I—I. Чистая стратегияА₂является оптимальной для игрока А, а чистая стратегия В₁ —для игрока В.

Оптимальное решение: S^*_A = (0;1), S^*_B = (1;0), цена игры v=а₂₁= =, т.е. имеется седловая точка.

18. Решение игр 2хn

Пусть мы располагаем двумя стратегиями А₁, А_2, а противник – n стратегиями: В₁, В₂ …В_n. Матрица || a_ij || состоит из двух строк и n столбцов. Аналогично случаю двух стратегий дадим задаче геометрическую интерпретацию: n стратегий противника изобразятся n прямыми.

Строим нижнюю границу выигрыша (ломаную В₁MN В₂) и находим на ней точку N с максимальной ординатой.

Эта точка дает решение игры (стратегию):

ордината точки N равна цене игры, а абсцисса равна частоте стратегии

_{В
данном случае (см. рисунок) оптимальная
стратегия противника получается
применением смеси двух «полезных»
стратегий:}В_1
иВ_{4,
пересекающихся в точке}_N_.

Стратегия B3 является заведомо невыгодной, а стратегия B1 – невыгодной при оптимальной стратегии . Если А будет придерживаться своей оптимальной стратегии, то выигрыш не изменится, какой бы из своих «полезных» стратегий ни пользовался В, однако, он изменится, если В перейдет к стратегиям B1 или B3.

В теории игр доказывается, что у любой конечной игры mn имеется решение, в котором число «полезных» стратегий той и другой стороны не превосходит наименьшего из двух чисел m и n. В частности, из этого следует, что у игры 2n всегда имеется решение, в котором с той и другой стороны участвует не более двух «полезных» стратегий.

Пользуясь геометрической интерпретацией, можно дать простой способ решения любой игры 2n. Непосредственно по чертежу находим пару «полезных» стратегий противника Bj и Bk, пересекающиеся в точке N (если в точке N пересекается более двух стратегий, берем любые две из них). Мы знаем, что если игрок А придерживается своей оптимальной стратегии, то выигрыш не зависит от того, в какой пропорции применяет В свои «полезные» стратегии, следовательно,

Из этих уравнений и условия , находим и и цену игры v (В методе цена игры обозначается, как ).

Зная стратегию игры, можно сразу определить оптимальную стратегию игрока В:

Для этого решается, например, уравнение:

ДРУГОЙ ПРИМЕР (БОЛЕЕ ПОНЯТНЫЙ)

Любая конечная игра mn имеет решение, в котором число активных стратегий каждого игрока не превосходит L, где L = min (m, n)

У игры 2n или m2 всегда имеется решение, содержащее не более двух активных стратегий у каждого из игроков (min(2, n)=min(m,2)=2).

Пусть платежная матрица игры имеет вид:

Согласно теореме об активных стратегиях, решение находится из уравнения:

Найти максимум (по р) функции:

Для этого необходимо построить n прямых вида:

На плоскости (p,, p[0,1] и путем визуального сравнения выбрать ломанную, огибающую их снизу

Пример:

Матричная игра 2n задана следующей матрицей:

Найти: решение игры графическим и аналитическим методом.

Решение:

Сначала необходимо определит, решается ли данная игра в чистых стратегиях, то есть существует ли седловая точка или нет.

Вычисляя, получим:

Цена игры

Так как , то игра имеет седловой точки, и поэтому имеет решение в смешанных стратегиях.

Строим графическое изображение игры:

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_11_А. Франс для эл версии
_3 тема - Диффузия
_индив анализ данных