КПМиИТ. Библиотека. Учебные пособия. Л.Т. Ащепков. Элементы исследования операций



6. БИМАТРИЧНАЯ ИГРА «ЗАЧЕТ»

6.1. Матричная интерпретация игры. Игра, рассмотренная в примере 1.5, задана таблицами 1.3, 1.4. Сформируем по данным таблиц  матрицы выигрышей

                                     (6.1)

с элементами

a11 = 2,       a12 = -1,     a21 = 1,       a22 = 0;                            (6.2)

b11 = 0,       b12 = -2,     b21 = -3,     b22 = 1.

           Как и в матричной игре, пара матриц (6.1) однозначно задает правила биматричной игры. Стратегиями первого и второго игроков служат соответственно номера   i = 1, 2  строк и   j = 1, 2  столбцов этих матриц. Если игроки независимо выбрали свои стратегии  i, j  и в игре сложилась ситуация  (i, j), то выигрышем первого игрока будет элемент  аi j  матрицы  A, а выигрышем второго – элемент  bi j  матрицы  B. Цель каждого игрока состоит в максимизации индивидуального выигрыша.

           6.2. Равновесные ситуации. Ситуация  (i*, j*), в которой выполняются неравенства

 ,     i = 1,2;           ,   j = 1,2,

называется равновесной.

          В равновесной ситуации игроки добиваются наибольших выигрышей стратегиями   i = i*, j = j*. Их называют равновесными стратегиями, а соответствующие элементы  ,   матриц выигрышей – равновесными выигрышами игроков.

        При  B = - A, т.е.

 ,      i, j = 1,2,

биматричная игра превращается в матричную игру. В этом случае из определения равновесных стратегий вытекает

 ,      i, j = 1,2.

Отсюда

,

что означает оптимальность стратегий  i*, j*  в матричной игре (см. п. 5.2) с матрицей выигрыша  А. Следовательно, определение равновесных стратегий включает в себя понятие оптимальных стратегий матричной игры.

        Равновесные выигрыши одновременно максимальны в столбце матрицы  А  и строке матрицы  B  соответственно. Это свойство можно использовать как рабочее правило для нахождения равновесных ситуаций.

         Применим правило к матрицам выигрышей (6.1). Подставив в (6.1) численные значения элементов (6.2), получим

  .

          Ситуация (1,1) равновесная, поскольку для первого столбца матрицы  А  и первой строки матрицы   В  имеем

 2 = а11    а21 = 1,   0 = b11  ≥  b12 = - 2.

Ситуация (2, 2) тоже равновесная: 0 ≥ - 1  и  -1 ≥ -3. Ситуации (1,2) и (2,1) не равновесные. Равновесные выигрыши игроков (2 и 0) в первой равновесной ситуации превосходят аналогичные выигрыши (0 и –1) во второй, поэтому первая ситуация предпочтительней для игроков. Содержательно в равновесных ситуациях воплощается «закон кармы»: за хорошую подготовку к зачету Студент получает зачет, а за плохую подготовку по справедливости не получает. Моральное удовлетворение Студента и Преподавателя в первой ситуации выше, чем во второй.

         6.3. Смешанное расширение биматричной игры. У читателя после знакомства с п. 6.2 может сложиться впечатление, что биматричные игры решаются проще, чем матричные. Однако, это не совсем так.

        Рассмотрим, например, игру «семейный спор» с матрицами выигрыша

  .                                         (6.3)

Ее можно интерпретировать как выбор супругами совместного вечернего развлечения: спортивного соревнования, в котором заинтересован супруг (первый игрок), или балета, которому в равной степени отдает предпочтение супруга (второй игрок). В случае разногласия (выбора разных стратегий) нулевые выигрыши означают безнадежно испорченный вечер.

         Легко видеть, что в игре «семейный спор» нет равновесных ситуаций и, следовательно, нет предпочтительных стратегий, как было в игре о «зачете».

        Построим по аналогии с п. 5.3 смешанное расширение  ГА,В   этой игры. Определим множества смешанных стратегий

Х = {х= (х1, х2):   х1 + х2 = 1,  х1 ≥ 0,    х2 ≥  0 },

Y = { y = (y1, y2):   y1 + y2 = 1,  y1 ≥ 0,    y2 ≥  0 }

и функции выигрыша

Н1(х, у) = 2х1у1+ х2у2,                                       (6.4)

Н2(х, у) = х1у1 + 2х2у2.                                       (6.5)

           В модельном представлении в игре  ГА,В   игроки независимо выбирают смешанные стратегии  х, у  из множеств  Х, Y . Когда выбор стратегий сделан и в игре сложилась  ситуация  (х, у), определяются выигрыши  Н1(х, у)  и  Н2(х, у)  первого и второго игрока. Целью каждого игрока является максимизация индивидуального выигрыша путем выбора стратегии из своего множества стратегий.

        Составляющие игры  ГА,В   имеют такой же содержательный смысл, как в матричной игре:

        х1 и х2 – вероятности (частоты) выбора чистых стратегий  i = 1  и  i = 2,

        у1 и у– вероятности (частоты) выбора чистых стратегий  j = 1  и  j = 2,

        Н1(х, у) и Н2(х, у)  – математические ожидания выигрыша («средние» выигрыши) первого и второго игрока в ситуации  (х, у).

        Назовем ситуацию  (х*, у*)  и смешанные стратегии  х*, у*  равновесными, если неравенства

  Н1(х*, у*) ≥ Н1(х, у*),     Н2(х*, у*) ≥ Н2(х*, у)                  (6.6)

выполняются для любых смешанных стратегий  х, у.

        В равновесной ситуации стратегии   х = х*, у = у*  обеспечивают игрокам максимальные равновесные выигрыши  Н1(х*, у*), Н2(х*, у*), поэтому для игроков они представляют первоочередной интерес.

        Покажем существование равновесных ситуаций в смешанных стратегиях. Положим по аналогии с матричной игрой

 х = (х1, х2) = (р, 1 - р),   0 ≤ р ≤ 1;

 у = (у1, у2) = (q, 1 - q),   0 ≤ q ≤ 3.                              (6.7)

        Формулы (6.7) устанавливают взаимно однозначное соответствие между ситуациями   (х, у)  в смешанных стратегиях и точками  (р, q)  единичного квадрата  0 ≤ р, q ≤  1. Подставляя (6.7) в (6.4), (6.5), получим

  Н(1) (р, q) = 3рq - рq + 1,                                         (6.8)

 Н(2) (р, q) = 3рq – 2р – 2q + 2.                                     (6.9)

          Если  (р*, q*) – прообраз равновесной ситуации  (х*, у*), то по ее определению имеем

  Н(1) (р*, q*) ≥ Н(1) (р, q*),       Н(2) (р*, q*) ≥  Н(2) (р*, q)                 (6.10)

для любых  0 ≤ р, q ≤ 1   или, учитывая (6.8), (6.9),

 3р*q* - р* - q* + 1 ≥ 3рq*рq* + 1,

 3р*q* – 2р* – 2q* + 2 ≥ 3р*q – 2р* – 2q + 2.

Отсюда после несложных преобразований получим систему неравенств

 (р* - р) (q* - 1/3) ≥ 0,   (р* – 2/3) (q*q) ≥  0

относительно неизвестных   р*, q*, которая должна выполняться для всех  0 ≤ р, q ≤  1. Используя последнее условие, находим три равновесные ситуации  (0, 0), (1, 1), (2/3, 1/3). Определяя по формулам (6.7) их образы и подсчитывая равновесные выигрыши (6.8), (6.9), получим полный набор равновесных ситуаций в игре  ГА,В   (табл. 6.1).

        В третьей равновесной ситуации игроки имеют равные «средние» выигрыши, что можно расценить как достижение игроками разумного компромисса. Следовательно, отвечающие ей равновесные стратегии и равновесные выигрыши и надо считать решением игры. Суть компромисса между супругами во взаимных уступках с определенной частотой при выборе вечерних развлечений.

          6.4. Чувствительность равновесных стратегий в игре «семейный спор». Матрицы выигрышей (6.3) отражают одинаковую заинтересованность супругов в «любимых» и «не очень любимых» развлечениях. Это проявляется в том, что на главных диагоналях матриц находятся одни и те же элементы. Разберем более сложную игру  Г А,В (а)  с матрицами выигрыша

.                              (6.11)

 Параметр а  в первой матрице характеризует отношение супруга к балету от полного неприятия (а = - ∞) до безграничного обожания (а = ∞). При  а = 1 получим исходную игру «семейный спор».

Таблица 6.1

Равновесные ситуации в игре  ГА,В  


х*



у*


Н 1(х*, у*)


Н 2(х*, у*)


(1,0)


(1,0)


1


2


(0, 1)


(0, 1)


2


1


  (2/3, 1/3)  


  (1/3, 2/3)  


2/3


2/3

          В игре  ГА,В (а)  две равновесные ситуации в чистых стратегиях:

 (1,1),  ( -∞ < а < ∞);       (2,2),  (а ≥ 0).                          (6.12)

         Для нахождения смешанных равновесных ситуаций составим, как и ранее, функции средних выигрышей

Н1(х, у) = 2х1у1 + ах2у2 ,        Н2(х, у) = х1у1 + 2х2у2,                 (6.13)

определив их на множестве всех смешанных ситуаций. Выполнив подстановку (6.7), найдем представление функций (6.13) в квадрате  0 ≤ р, q ≤ 1:

Н(1)(р, q) = (2 + а)рqараq + а,

                          Н(2) (р, q) = 3рq – 2р – 2q + 2.                                     (6.14)

          Запишем для  выигрышей (6.14) условия равновесности (6.10). Рассмотрим отдельно случаи  а = –2  и  а  ≠ –2. Выполнив очевидные преобразования, получим относительно неизвестных   р*, q*  соответствующие системы из двух неравенств

p*p ≥ 0,    (р* – 2/3) (q*q) ≥  0   (а = –2);                   (6.15)

(а +2) ( p*p) (q* – а/ (а + 2)) ≥ 0,  (р* – 2/3) (q*q) ≥0   (а  ≠ –2),      (6.16)

которые по смыслу должны выполняться для любых  0 ≤ р, q ≤ 1. 

        Условия (6.15) удовлетворяются при   p* = 1, q* = 1  и новой, по сравнению с (6.12), равновесной ситуации не дают. Неравенства (6.16) с учетом  требования  0 ≤ q* ≤ 1 имеют очевидное решение

р* = 2/3,     q* = а/(а + 2)       (а ≥0).                            (6.17)

Легко проверить, что других равновесных ситуаций, кроме (6.12) и (6.17), неравенства (6.16) не содержат.

        Полный перечень равновесных ситуаций в игре приведен в табл. 6.2.


Таблица 6.2

Равновесные ситуации в игре  ГА,В (а)


а


х*


у*


   Н 1(х*, у*)    


   Н 2(х*, у*)   


  -∞ < а < ∞  


(1, 0)


(1, 0)


2


 1


а ≥  0


(0, 1)


(0, 1)


а


2


а ≥  0


      (2/3, 1/3)    

 






2/3


          Как видно из таблицы, еще один компромисс, приводящий к равным выигрышам игроков, возможен во второй равновесной ситуации при  а = 2. В этом случае залог семейного благополучия в общности интересов супругов. Точнее говоря, увлечения супруга спортивными соревнованиями и балетом должны быть такими же, как увлечение супруги балетом.

Вопросы и упражнения

  1. Найдите ситуации равновесия в играх с матрицами выигрыша

;      .

  1. Если одна из биматричных игр в упражнении 1 не имеет ситуации                 равновесия, найдите решение в смешанных стратегиях.

  2.  Поменяйте ролями игроков в игре (6.11) и найдите ее решение. Как изменится решение по сравнению с указанным в таблице 6.2?

  3. Говорят, что матрица  А  (вида (6.1)) имеет седловую точку  (i*, j*), если для ее элементов выполнены неравенства

                     i, j = 1,2. 

Из этого определения вытекает «прямоугольное» свойство седловых точек: если  (i1, j1)  и  (i2, j2) – седловые точки матрицы  А, то  (i1, j2)  и  (i2, j1)  тоже будут седловыми точками той же матрицы. Обладают ли ситуации равновесия в биматричной игре тем же «прямоугольным» свойством? Приведите примеры.

  1.  Определение (6.6) равновесной ситуации  (х*, у*)  показывает, что она образована точками  х*  максимума функции   Н1(х, у*)  по  стратегиям  х  и одновременно точками   у*   максимума функции  Н2(х*, у)  по стратегиям  у. Переформулируйте это же в терминах вспомогательных переменных (6.7). Постройте для функций (6.8), (6.9) множества точек максимума на координатной плоскости переменных  р*, q*  и найдите их общие точки. Совпадут ли они с точками (0, 0), (1, 1), (2/3, 1/3)? Если да, то как это можно объяснить? Можно ли таким образом находить смешанные равновесные стратегии в биматричной игре с произвольными матрицами вида (6.1)?

Начало раздела 6
Предыдущий раздел 5
Следующий раздел 7
Содержание пособия

По всем вопросам относительно данного учебного пособия можно обращаться к автору, Ащепкову Леониду Тимофеевичу