КПМиИТ. Библиотека. Учебные пособия. Л.Т. Ащепков. Элементы исследования операций
6. БИМАТРИЧНАЯ ИГРА «ЗАЧЕТ»
6.1. Матричная интерпретация игры. Игра, рассмотренная в примере 1.5, задана таблицами 1.3, 1.4. Сформируем по данным таблиц матрицы выигрышей
(6.1)
с элементами
a11 = 2, a12 = -1, a21 = 1, a22 = 0; (6.2)
b11 = 0,  b12 = -2, b21 = -3, b22 = 1.
Как и в матричной игре, пара матриц (6.1) однозначно задает правила биматричной игры. Стратегиями первого и второго игроков служат соответственно номера i = 1, 2 строк и j = 1, 2 столбцов этих матриц. Если игроки независимо выбрали свои стратегии i, j и в игре сложилась ситуация (i, j), то выигрышем первого игрока будет элемент аi j матрицы A, а выигрышем второго – элемент bi j матрицы B. Цель каждого игрока состоит в максимизации индивидуального выигрыша.
6.2. Равновесные ситуации. Ситуация (i*, j*), в которой выполняются неравенства
, i = 1,2; , j = 1,2,
называется равновесной.
В равновесной ситуации игроки добиваются наибольших выигрышей стратегиями i = i*, j = j*. Их называют равновесными стратегиями, а соответствующие элементы , матриц выигрышей – равновесными выигрышами игроков.
При B = - A, т.е.
, i, j = 1,2,
биматричная игра превращается в матричную игру. В этом случае из определения равновесных стратегий вытекает
, i, j = 1,2.
Отсюда
,
что означает оптимальность стратегий i*, j* в матричной игре (см. п. 5.2) с матрицей выигрыша А. Следовательно, определение равновесных стратегий включает в себя понятие оптимальных стратегий матричной игры.
Равновесные выигрыши одновременно максимальны в столбце матрицы А и строке матрицы B соответственно. Это свойство можно использовать как рабочее правило для нахождения равновесных ситуаций.
Применим правило к матрицам выигрышей (6.1). Подставив в (6.1) численные значения элементов (6.2), получим
.
Ситуация (1,1) равновесная, поскольку для первого столбца матрицы А и первой строки матрицы В имеем
2 = а11 ≥ а21 = 1, 0 = b11 ≥ b12 = - 2.
Ситуация (2, 2) тоже равновесная: 0 ≥ - 1 и -1 ≥ -3. Ситуации (1,2) и (2,1) не равновесные. Равновесные выигрыши игроков (2 и 0) в первой равновесной ситуации превосходят аналогичные выигрыши (0 и –1) во второй, поэтому первая ситуация предпочтительней для игроков. Содержательно в равновесных ситуациях воплощается «закон кармы»: за хорошую подготовку к зачету Студент получает зачет, а за плохую подготовку по справедливости не получает. Моральное удовлетворение Студента и Преподавателя в первой ситуации выше, чем во второй.
6.3. Смешанное расширение биматричной игры. У читателя после знакомства с п. 6.2 может сложиться впечатление, что биматричные игры решаются проще, чем матричные. Однако, это не совсем так.
Рассмотрим, например, игру «семейный спор» с матрицами выигрыша
. (6.3)
Ее можно интерпретировать как выбор супругами совместного вечернего развлечения: спортивного соревнования, в котором заинтересован супруг (первый игрок), или балета, которому в равной степени отдает предпочтение супруга (второй игрок). В случае разногласия (выбора разных стратегий) нулевые выигрыши означают безнадежно испорченный вечер.
Легко видеть, что в игре «семейный спор» нет равновесных ситуаций и, следовательно, нет предпочтительных стратегий, как было в игре о «зачете».
Построим по аналогии с п. 5.3 смешанное расширение ГА,В этой игры. Определим множества смешанных стратегий
Х = {х= (х1, х2): х1 + х2 = 1, х1 ≥ 0, х2 ≥ 0 },
Y = { y = (y1, y2): y1 + y2 = 1, y1 ≥ 0, y2 ≥ 0 }
и функции выигрыша
Н1(х, у) = 2х1у1+ х2у2, (6.4)
Н2(х, у) = х1у1 + 2х2у2. (6.5)
В модельном представлении в игре ГА,В игроки независимо выбирают смешанные стратегии х, у из множеств Х, Y . Когда выбор стратегий сделан и в игре сложилась ситуация (х, у), определяются выигрыши Н1(х, у) и Н2(х, у) первого и второго игрока. Целью каждого игрока является максимизация индивидуального выигрыша путем выбора стратегии из своего множества стратегий.
Составляющие игры ГА,В имеют такой же содержательный смысл, как в матричной игре:
х1 и х2 – вероятности (частоты) выбора чистых стратегий i = 1 и i = 2,
у1 и у2 – вероятности (частоты) выбора чистых стратегий j = 1 и j = 2,
Н1(х, у) и Н2(х, у) – математические ожидания выигрыша («средние» выигрыши) первого и второго игрока в ситуации (х, у).
Назовем ситуацию (х*, у*) и смешанные стратегии х*, у* равновесными, если неравенства
Н1(х*, у*) ≥ Н1(х, у*), Н2(х*, у*) ≥ Н2(х*, у) (6.6)
выполняются для любых смешанных стратегий х, у.
В равновесной ситуации стратегии х = х*, у = у* обеспечивают игрокам максимальные равновесные выигрыши Н1(х*, у*), Н2(х*, у*), поэтому для игроков они представляют первоочередной интерес.
Покажем существование равновесных ситуаций в смешанных стратегиях. Положим по аналогии с матричной игрой
х = (х1, х2) = (р, 1 - р), 0 ≤ р ≤ 1;
у = (у1, у2) = (q, 1 - q), 0 ≤ q ≤ 3. (6.7)
Формулы (6.7) устанавливают взаимно однозначное соответствие между ситуациями (х, у) в смешанных стратегиях и точками (р, q) единичного квадрата 0 ≤ р, q ≤ 1. Подставляя (6.7) в (6.4), (6.5), получим
Н(1) (р, q) = 3рq - р – q + 1, (6.8)
Н(2) (р, q) = 3рq – 2р – 2q + 2. (6.9)
Если (р*, q*) – прообраз равновесной ситуации (х*, у*), то по ее определению имеем
Н(1) (р*, q*) ≥ Н(1) (р, q*), Н(2) (р*, q*) ≥ Н(2) (р*, q) (6.10)
для любых 0 ≤ р, q ≤ 1 или, учитывая (6.8), (6.9),
3р*q* - р* - q* + 1 ≥ 3рq* – р – q* + 1,
3р*q* – 2р* – 2q* + 2 ≥ 3р*q – 2р* – 2q + 2.
Отсюда после несложных преобразований получим систему неравенств
(р* - р) (q* - 1/3) ≥ 0, (р* – 2/3) (q* – q) ≥ 0
относительно неизвестных р*, q*, которая должна выполняться для всех 0 ≤ р, q ≤ 1. Используя последнее условие, находим три равновесные ситуации (0, 0), (1, 1), (2/3, 1/3). Определяя по формулам (6.7) их образы и подсчитывая равновесные выигрыши (6.8), (6.9), получим полный набор равновесных ситуаций в игре ГА,В (табл. 6.1).
В третьей равновесной ситуации игроки имеют равные «средние» выигрыши, что можно расценить как достижение игроками разумного компромисса. Следовательно, отвечающие ей равновесные стратегии и равновесные выигрыши и надо считать решением игры. Суть компромисса между супругами во взаимных уступках с определенной частотой при выборе вечерних развлечений.
6.4. Чувствительность равновесных стратегий в игре «семейный спор». Матрицы выигрышей (6.3) отражают одинаковую заинтересованность супругов в «любимых» и «не очень любимых» развлечениях. Это проявляется в том, что на главных диагоналях матриц находятся одни и те же элементы. Разберем более сложную игру Г А,В (а) с матрицами выигрыша
. (6.11)
Параметр а в первой матрице характеризует отношение супруга к балету от полного неприятия (а = - ∞) до безграничного обожания (а = ∞). При а = 1 получим исходную игру «семейный спор».
Таблица 6.1
Равновесные ситуации в игре ГА,В
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В игре ГА,В (а) две равновесные ситуации в чистых стратегиях:
(1,1), ( -∞ < а < ∞); (2,2), (а ≥ 0). (6.12)
Для нахождения смешанных равновесных ситуаций составим, как и ранее, функции средних выигрышей
Н1(х, у) = 2х1у1 + ах2у2 , Н2(х, у) = х1у1 + 2х2у2, (6.13)
определив их на множестве всех смешанных ситуаций. Выполнив подстановку (6.7), найдем представление функций (6.13) в квадрате 0 ≤ р, q ≤ 1:
Н(1)(р, q) = (2 + а)рq – ар – аq + а,
Н(2) (р, q) = 3рq – 2р – 2q + 2. (6.14)
Запишем для выигрышей (6.14) условия равновесности (6.10). Рассмотрим отдельно случаи а = –2 и а ≠ –2. Выполнив очевидные преобразования, получим относительно неизвестных р*, q* соответствующие системы из двух неравенств
p* – p ≥ 0, (р* – 2/3) (q* – q) ≥ 0 (а = –2); (6.15)
(а +2) ( p* – p) (q* – а/ (а + 2)) ≥ 0, (р* – 2/3) (q* – q) ≥0 (а ≠ –2), (6.16)
которые по смыслу должны выполняться для любых 0 ≤ р, q ≤ 1.
Условия (6.15) удовлетворяются при p* = 1, q* = 1 и новой, по сравнению с (6.12), равновесной ситуации не дают. Неравенства (6.16) с учетом требования 0 ≤ q* ≤ 1 имеют очевидное решение
р* = 2/3, q* = а/(а + 2) (а ≥0). (6.17)
Легко проверить, что других равновесных ситуаций, кроме (6.12) и (6.17), неравенства (6.16) не содержат.
Полный перечень равновесных ситуаций в игре приведен в табл. 6.2.
Таблица 6.2
Равновесные ситуации в игре ГА,В (а)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Как видно из таблицы, еще один компромисс, приводящий к равным выигрышам игроков, возможен во второй равновесной ситуации при а = 2. В этом случае залог семейного благополучия в общности интересов супругов. Точнее говоря, увлечения супруга спортивными соревнованиями и балетом должны быть такими же, как увлечение супруги балетом.
Вопросы и упражнения
Найдите ситуации равновесия в играх с матрицами выигрыша
; .
Если одна из биматричных игр в упражнении 1 не имеет ситуации равновесия, найдите решение в смешанных стратегиях.
Поменяйте ролями игроков в игре (6.11) и найдите ее решение. Как изменится решение по сравнению с указанным в таблице 6.2?
Говорят, что матрица А (вида (6.1)) имеет седловую точку (i*, j*), если для ее элементов выполнены неравенства
i, j = 1,2.
Из этого определения вытекает «прямоугольное» свойство седловых точек: если (i1, j1) и (i2, j2) – седловые точки матрицы А, то (i1, j2) и (i2, j1) тоже будут седловыми точками той же матрицы. Обладают ли ситуации равновесия в биматричной игре тем же «прямоугольным» свойством? Приведите примеры.
Определение (6.6) равновесной ситуации (х*, у*) показывает, что она образована точками х* максимума функции Н1(х, у*) по стратегиям х и одновременно точками у* максимума функции Н2(х*, у) по стратегиям у. Переформулируйте это же в терминах вспомогательных переменных (6.7). Постройте для функций (6.8), (6.9) множества точек максимума на координатной плоскости переменных р*, q* и найдите их общие точки. Совпадут ли они с точками (0, 0), (1, 1), (2/3, 1/3)? Если да, то как это можно объяснить? Можно ли таким образом находить смешанные равновесные стратегии в биматричной игре с произвольными матрицами вида (6.1)?
Начало раздела 6
Предыдущий раздел 5
Следующий раздел 7
Содержание пособия
По всем вопросам относительно данного учебного пособия можно обращаться к автору, Ащепкову Леониду Тимофеевичу