игра в нормальной форме
Игры в нормальной и развернутой форме
Игра — это процесс, в котором участвуют две или более сторон, ведущих борьбу за собственные интересы. У каждого игрока есть набор доступных стратегий, и соответствующих выигрышей, которые так же зависят от выбора стратегии остальными игроками.
Основными признаками игры как математической модели являются:
Чаще всего математические игры представляют одним из двух способов: в нормальной или в развернутой (экстенсивной) форме.
Игра в нормальной форме описывается платежной матрицей (в виде таблицы). Каждое измерение матрицы – это игрок. Строки определяют стратегии первого игрока, столбцы – стратегии второго. На пересечении столбца и строки можно увидеть выигрыши, которые получают игроки. В примере на рисунке, если первый игрок выбирает стратегию F, а второй игрок стратегию А, то выигрыш каждого игрока составит 5.
На рисунке — игра для двух игроков. Игрок 1 ходит первым и выбирает стратегию F или U. Игрок 2 анализирует свою позицию и решает — выбрать стратегию A или R. Скорее всего первый игрок выберет U, а второй — A (для каждого из них это оптимальные стратегии); тогда они получат соответственно 8 и 2 очка.
Экстенсивная форма очень наглядна, с её помощью особенно удобно представлять игры с более чем двумя игроками и игры с последовательными ходами.
Подробнее о теории игр:
A Course in Game Theory by Martin J. Osborne and Ariel Rubinstein
В теория игры, нормальная форма это описание игра. В отличие от обширная форма, представления в нормальной форме не являются графическими как таковой, а скорее представляют игру в виде матрица. Хотя этот подход может быть более полезным при выявлении строго доминируемые стратегии и Равновесия Нэша, некоторая информация теряется по сравнению с представлениями в развернутой форме. Представление игры в нормальной форме включает в себя все ощутимое и мыслимое. стратегиии соответствующие выплаты для каждого игрока.
Содержание
Пример
Другие представления
Часто, симметричные игры (где выплаты не зависят от того, какой игрок выбирает каждое действие) представлены только одной выплатой. Это выигрыш для рядового игрока. Например, матрицы выигрышей справа и слева ниже представляют одну и ту же игру.
Топологическое пространство игр со связанными матрицами выигрыша также может быть отображено, при этом смежные игры имеют наиболее похожие матрицы. Это показывает, как постепенные изменения стимулов могут изменить игру.
Использование нормальной формы
Доминируемые стратегии
Матрица выплат позволяет исключить доминирующие стратегии, и он обычно используется для иллюстрации этой концепции. Например, в Дилемма заключенного, мы видим, что каждый заключенный может либо «сотрудничать», либо «дезертировать». Если ошибается ровно один заключенный, он легко выходит, а другой заключенный надолго запирается. Однако, если они оба дезертируют, они оба будут заключены в тюрьму на более короткий срок. Можно определить, что Сотрудничать строго доминирует Дефект. Необходимо сравнить первые числа в каждом столбце, в данном случае 0> −1 и −2> −5. Это показывает, что независимо от того, что выбирает игрок столбца, игрок строки добивается большего успеха, выбирая Дефект. Точно так же сравнивают вторую выплату в каждой строке; снова 0> −1 и −2> −5. Это показывает, что независимо от того, какая строка делает, столбец работает лучше, выбирая Дефект. Это демонстрирует уникальное равновесие по Нэшу этой игры (Дефект, Дефект).
Последовательные игры в нормальной форме
Эти матрицы представляют только игры, в которых ходы являются одновременными (или, в более общем смысле, информация несовершенный). Вышеупомянутая матрица не представляет игру, в которой игрок 1 ходит первым, за которым наблюдает игрок 2, а затем ходит игрок 2, поскольку в этом случае она не определяет каждую из стратегий игрока 2. Чтобы представить это последовательная игра мы должны указать все действия игрока 2, даже в непредвиденных случаях, которые никогда не могут возникнуть в ходе игры. В этой игре у игрока 2, как и прежде, есть действия: Оставили и Правильно. В отличие от предыдущего, у него есть четыре стратегии, зависящие от действий игрока 1. Стратегии:
Общая формулировка
Для того, чтобы игра была в нормальном виде, нам предоставляются следующие данные:
А чистый стратегический профиль представляет собой ассоциацию стратегий для игроков, то есть м-кортеж
А функция выплаты это функция
Определение: А игра в нормальной форме это структура
является м-набор наборов чистых стратегий, по одному для каждого игрока, и
Нормальная форма игры
В теории игр, игра в нормальной форме (или стратегической форме) состоит из трех элементов: множества игроков, множества чистых стратегий каждого игрока, множества платежных функций каждого игрока. Таким образом, игру в нормальной форме можно представить в виде n-мерной матрицы (таблицы), элементы которой это n-мерные платежные вектора.
Содержание
Два игрока/две стратегии
Случай двух игроков — двух чистых стратегий отображен на таблице. Чистые стратегии первого игрока: U и D. Чистые стратегии второго игрока: L и R. Если первый игрок выбирает U, а второй игрок (единовременно) выбирает L, то соответствующие платежи равны 4 и 3 (первый элемент вектора (4, 3) обозначает платеж первого игрока, а второй — платеж второго игрока в случае, если были выбраны стратегии U и L). То есть чтобы найти распределение платежей, соответствующих каждому набору сыгранных стратегий, необходимо просто найти вектор, находящийся на пересечении соответствующих рядов и колонок таблицы (ряды соответствуют стратегиям первого игрока, а колонки — стратегиям второго игрока). Сыгранная комбинация стратегий называется исходом игры. В данном примере исход игры (U, L). Все возможные исходы для этой игры: <(U, L), (U, R), (D, L), (D, R)>. Очевидно, каждая ячейка таблицы соответствует одному из возможных исходов.
Функция полезности
В общем случае предполагается, что игрок имеет предпочтения на множестве исходов. То есть для каждого игрока заданы бинарные отношения между элементами этого множества. Это значит, что игрок может сравнить любые два исхода: игрок или отдает предпочтение одному из двух исходов или остаться безразличным между обоими исходами. При определенных дополнительных предположениях относительно предпочтений игрока можно показать, что существует функция полезности Неймана-Монгенштерна представляющая полезность каждого исхода как действительное число u(s), при чем если u(s)≥u(s’) игрок предпочитает (или безразличен) исход s исходу s’. В нашем примере первый игрок предпочитает исход (U, L) исходу (D, R) так как 4>3.
Игры с полной/неполной информацией
В играх с полной информацией описание игры известно всем игрокам (все игроки знают чистые стратегии и функции полезности всех остальных игроков). В играх с неполной информацией некоторые игроки могут не знать функции полезности других игроков (то есть не знать некоторые конкретные значения для ячеек таблицы из нашего примера).
Любая игра в экстенсивной форме может быть представлена игрой в нормальной форме (не обязательно эквивалентной). Представление игры в нормальной форме может быть использовано для нахождения доминируемых стратегий.
Формальное представление
У каждого игрока имеется конечный набор чистых стратегий
Исход игры — это комбинация чистых стратегий каждого игрока:
Функция полезности i-го игрока (функция платежа):
Def.: В нормальной форме игра представляется как множество:
» border=»0″/>
— множество множеств чистых стратегий каждого игрока,
— множество функций платежей для каждого игрока
В теория игры, нормальная форма это описание игра. В отличие от обширная форма, представления в нормальной форме не являются графическими как таковой, а скорее представляют игру в виде матрица. Хотя этот подход может быть более полезным при выявлении строго доминируемые стратегии и Равновесия Нэша, некоторая информация теряется по сравнению с представлениями в развернутой форме. Представление игры в нормальной форме включает в себя все ощутимое и мыслимое. стратегиии соответствующие выплаты для каждого игрока.
Содержание
Пример
Другие представления
Часто, симметричные игры (где выплаты не зависят от того, какой игрок выбирает каждое действие) представлены только одной выплатой. Это выигрыш для рядового игрока. Например, матрицы выигрышей справа и слева ниже представляют одну и ту же игру.
Топологическое пространство игр со связанными матрицами выигрыша также может быть отображено, при этом смежные игры имеют наиболее похожие матрицы. Это показывает, как постепенные изменения стимулов могут изменить игру.
Использование нормальной формы
Доминируемые стратегии
Матрица выплат позволяет исключить доминирующие стратегии, и он обычно используется для иллюстрации этой концепции. Например, в Дилемма заключенного, мы видим, что каждый заключенный может либо «сотрудничать», либо «дезертировать». Если ошибается ровно один заключенный, он легко выходит, а другой заключенный надолго запирается. Однако, если они оба дезертируют, они оба будут заключены в тюрьму на более короткий срок. Можно определить, что Сотрудничать строго доминирует Дефект. Необходимо сравнить первые числа в каждом столбце, в данном случае 0> −1 и −2> −5. Это показывает, что независимо от того, что выбирает игрок столбца, игрок строки добивается большего успеха, выбирая Дефект. Точно так же сравнивают вторую выплату в каждой строке; снова 0> −1 и −2> −5. Это показывает, что независимо от того, какая строка делает, столбец работает лучше, выбирая Дефект. Это демонстрирует уникальное равновесие по Нэшу этой игры (Дефект, Дефект).
Последовательные игры в нормальной форме
Эти матрицы представляют только игры, в которых ходы являются одновременными (или, в более общем смысле, информация несовершенный). Вышеупомянутая матрица не представляет игру, в которой игрок 1 ходит первым, за которым наблюдает игрок 2, а затем ходит игрок 2, поскольку в этом случае она не определяет каждую из стратегий игрока 2. Чтобы представить это последовательная игра мы должны указать все действия игрока 2, даже в непредвиденных случаях, которые никогда не могут возникнуть в ходе игры. В этой игре у игрока 2, как и прежде, есть действия: Оставили и Правильно. В отличие от предыдущего, у него есть четыре стратегии, зависящие от действий игрока 1. Стратегии:
Общая формулировка
Для того, чтобы игра была в нормальном виде, нам предоставляются следующие данные:
А чистый стратегический профиль представляет собой ассоциацию стратегий для игроков, то есть м-кортеж
А функция выплаты это функция
Определение: А игра в нормальной форме это структура
является м-набор наборов чистых стратегий, по одному для каждого игрока, и
Игра в нормальной форме
Итак, выше описана игра в нормальной форме, где выигрыш [c.17]
Логичным продолжением перехода от игр в нормальной форме [c.22]
Как отмечалось выше, игра в нормальной форме [c.24]
Игры в нормальной форме [c.23]
Для произвольной игры в нормальной форме Г = [c.66]
Подставляя (4)-(7) в (8), получим игру в нормальной форме, в [c.46]
Рефлексивная игра в нормальной форме задается кортежем [c.61]
Примером игры в нормальной форме является описанная в 3-м выпуске журнала игра дуополии, в которой принимают участие 2 игрока стратегия игрока — количество предлагаемого им на рынке товара, выигрыш игрока — его прибыль. Прибыль зависит от цены, обусловленной количеством товара на рынке. Другой вариант игры возникает, если количества предлагаемых товаров фиксированы, а стратегиями игроков (продавцов) являются назначаемые ими цены. [c.373]
Дж. фон Нейманом была показана сводимость позиционных игр к играм в нормальной форме. [c.373]
Для игр в нормальной форме определения принципа оптимальности сначала не было. [c.374]
Это напоминает написание уравнения химической реакции, которое уже дает важную информацию о происходящем процессе, оставляя «за кадром» его интимную сущность, представления о молекулах как пространственных конфигурациях атомов, судьбы передаваемых электронов, игру электромагнитных сил и т.д. Поэтому говорят даже о задании игр «в форме характеристической функции», противопоставляя его заданию игр «в нормальной форме», т.е. в виде (5.1), и в других формах, о которых в данной книге говориться не будет. Изучение характеристических функций игр и составляет содержание кооперативной теории игр. [c.19]
Возможно также более общее — обобщенное представление игр в нормальной форме (оно соответствует общему Вальрасовскому равновесию и мы далее обращаемся к нему только в соответствующем разделе) Оно предполагает, что текущее допустимое множество стратегий В х ) с Xi каждого участника может зависеть от текущих действий х других участников. В этом случае игра есть [c.3]
Найти решение игры означает указать множество ее исходов (состояний, от которых участники не станут переходить к другим состояниям). Решений может и не быть иногда игра не останавливается. В зависимости от конкретной гипотезы, которую мы примем о характере поведения и информации участников, мы можем прогнозировать разные типы решений. Мы будем изучать следующие решения игр в нормальной форме 2 [c.3]
Представление игры в виде дерева соответствует развернутой форме игры. В дальнейшем мы увидим, как можно представить динамическую игру в нормальной форме. А сейчас перечислим, что должно включать описание динамической игры (с совершенной информацией) в развернутой форме [c.654]
Для того, чтобы это сделать, следует записать динамическую игру в нормальной форме. Как мы помним, описание игры в нормальной форме состоит из задания (1) множества игроков, (2) множества стратегий каждого игрока и (3) функции выигрыша каждого игрока на множестве исходов. [c.657]
Процесс игры для динамической игры в нормальной форме можно условно представить себе следующим образом. Каждый игрок до начала игры сообщает выбранную им стратегию организатору игры. Организатор, руководствуясь этими стратегиями, осуществляет за игроков их ходы. Когда последовательность ходов приведет организатора в конечную [c.657]
При представлении динамической игры в нормальной форме теряется информация о последовательности ходов и информации, доступной игрокам на каждом ходе.251 [c.660]
Сам способ записи динамической игры в нормальной форме, как он описан выше, заключает в себе предположение, что игроки выбирают свои стратегии до начала игры раз и навсегда и уже не меняют их в дальнейшем в ходе игры. [c.660]
Баиесовои статической игры в нормальной форме имеем [c.138]
Его первые книги Политика ценообразования в статических многопродуктовых моделях (1970) и Общее равновесие при ценообразующих фирмах (1974), совместная с Т. Маршаком, рассматривают математические модели рынков, принятые в современной математической экономике. Для этих моделей Зелтен реально ощутил недостатки представления рынка обычной игрой в нормальной форме и применения к полученной игре такого принципа статической устойчивости, как ситуация равновесия по Нашу. В игре в нормальной форме предполагается, что правила игры и множества стратегий всех игроков полностью известны каждому участнику, но в рынках с большим числом участников каждый может знать разве лишь возможности ближайших партнеров, да и то не точно. Этот же недостаток игры в нормальной форме почувствовал Хар-шаньи при работе над проблемой переговоров о разоружении, где необходимо было моделировать неполное знание каждой [c.376]
Дальнейшие успехи Харшаньи и Зелтена в теории игр были сделаны на пути отказа от жестко заданных моделей игр в нормальной форме, возвращения к моделям многошаговых позиционных игр и изучения динамических процессов принятия решения. [c.376]
Сопоставляя концепции WE и NE, отметим, что если исходные данные рынка /, X, и, J, У, d, w, 7 естественным образом записать как обобщенную игру в нормальной форме G (включив аукционщика регулирующего цены в число участников), то ее Нэшевские равновесия совпадут с Вальрасовскими. Таким образом WE есть NE в обобщенной игре специального вида. [c.16]
Определение 1.12.1 Равновесие по Нэшу а в игре (в нормальной форме) Г = /, (Si), (иг-) называется равновесием дрожащей руки, если существует такая последовательность возмущенных игр Гед, 11 сходящихся к Т (в том смысле, что limezf (si) = 0 для любых г G / и 5г- G S ij, что существует последовательность равновесий (в соответствующих играх Гед, ) ak L1, сходящаяся к а, т.е. lim rf = а. [c.56]
Предложение 1.12.2 (Selten (1975)). Равновесие по Нэшу а в игре в нормальной форме Г = /, (Si), (иг-) является совершенным равновесием дрожащей руки (в игре в нормальной форме) тогда и только тогда, когда существует последовательность таких вполне смешанных стратегий ak (т. е. стратегий, в которых все чистые стратегии играются с положительными вероятностями), что ak —Y а и (Ji является лучшим ответом на любой элемент последовательности [c.56]
Предложение 1.12.3 (Selten (1975)). Если а = (