Halk teoremi (oyun teorisi) - Folk theorem (game theory)

İçinde oyun Teorisi, halk teoremleri bolluğunu tanımlayan bir teoremler sınıfıdır Nash dengesi ödeme profilleri tekrarlanan oyunlar (Friedman 1971 ).^[1] Orijinal Halk Teoremi, sonsuz tekrarlanan bir oyunun tüm Nash dengelerinin getirileriyle ilgiliydi. Bu sonuç Halk Teoremi olarak adlandırıldı çünkü 1950'lerde oyun teorisyenleri arasında, kimse yayınlamamasına rağmen yaygın olarak biliniyordu. Friedman'ın (1971) Teoremi, belirli alt oyun mükemmel Nash dengesi (SPE) ve böylece orijinal Halk Teoremini daha güçlü bir denge kavramı kullanarak güçlendirir: Nash dengesi yerine alt oyun mükemmel Nash dengesi.^[2]

Halk Teoremi, oyuncuların yeterince sabırlı ve ileri görüşlüyse (yani, indirim faktörü ${ displaystyle delta ila 1}$ ), daha sonra tekrarlanan etkileşim, bir SPE dengesinde hemen hemen her ortalama getiriye neden olabilir.^[3] "Hemen hemen her şey" burada teknik olarak "uygulanabilir" ve "bireysel olarak rasyonel" olarak tanımlanır.

Örneğin, tek seferde Mahkum İkilemi, her iki oyuncunun da işbirliği yapması Nash dengesi değildir. Tek Nash dengesi, her iki oyuncunun da kusurlu olmasıdır ki bu aynı zamanda karşılıklı bir minmax profilidir. Bir halk teoremi, oyunun sonsuz tekrarlanan versiyonunda, oyuncuların yeterince sabırlı olması koşuluyla, her iki oyuncunun da denge yolunda işbirliği yapacağı bir Nash dengesi olduğunu söyler. Ancak, oyun yalnızca bilinen sonlu sayıda tekrarlanırsa, geriye dönük çıkarım kullanılarak her iki oyuncunun da her periyotta tek atışlık Nash dengesini oynayacağı, yani her seferinde kaçacakları belirlenebilir.

Kurulum ve tanımlar

İle başlıyoruz temel oyunolarak da bilinir sahne oyunu, hangisi bir n-oyuncu oyunu. Bu oyunda, her oyuncunun aralarından seçim yapabileceği son derece fazla eylem vardır ve seçimlerini aynı anda ve diğer oyuncunun seçimlerini bilmeden yaparlar. Oyuncuların kolektif seçimleri bir getiri profili, yani oyuncuların her biri için bir ödeme. Toplu seçimlerden kazanç profillerine kadar olan eşleştirme oyuncular tarafından bilinir ve her oyuncu getirisini en üst düzeye çıkarmayı amaçlar. Kolektif seçim şu şekilde belirtiliyorsa: x, o oyuncunun getirisi ben oyuncu olarak da bilinen alır ben's Yarar, ile gösterilecek ${ displaystyle u_ {i} (x)}$ .

Daha sonra bu sahne oyununun sonlu veya sonsuz sayıda tekrarını düşünürüz. Her tekrarda, her oyuncu kendi sahne oyunu seçeneklerinden birini seçer ve bu seçimi yaparken, önceki yinelemelerde diğer oyuncuların seçimlerini de dikkate alabilir. Bu tekrarlanan oyunda strateji Oyunculardan biri için, önceki yinelemelerde diğer tüm oyuncuların seçimlerine dayalı olarak, sahne oyununun her yinelemesinde oyuncunun seçimini belirleyen belirleyici bir kuraldır. Oyuncuların her biri için bir strateji seçimi, strateji profili, ve tekrarlanan oyun için bir ödeme profiline yol açar. Böyle bir strateji profilinin, aşağıda ana hatları verilen bir ödeme profiline dönüştürülmesinin birkaç farklı yolu vardır.

Hiç Nash dengesi Tekrarlanan bir oyunun kazanç profili iki özelliği karşılamalıdır:

1. Bireysel akılcılık: kazanç, kurucu sahne oyununun minmax getiri profiline zayıf bir şekilde hakim olmalıdır. Yani, her bir oyuncunun denge getirisi en az o oyuncunun minimum getirisi kadar büyük olmalıdır. Bunun nedeni, minmax getirisinden daha azını başaran bir oyuncunun her zaman sadece minmax stratejisini her geçmişte oynayarak sapmaya teşvik etmesidir.

2. Fizibilite: getiri bir dışbükey kombinasyon sahne oyununun olası getiri profilleri. Bunun nedeni, tekrarlanan bir oyundaki getirinin, temel oyunlardaki getirilerin sadece ağırlıklı bir ortalaması olmasıdır.

Halk teoremleri kısmen ters iddialardır: belirli koşullar altında (her halk teoreminde farklıdır), derler ki, her Hem bireysel olarak rasyonel hem de uygulanabilir olan getiri profili, tekrarlanan oyunun Nash dengesi getiri profili olarak gerçekleştirilebilir.

Çeşitli halk teoremleri vardır; bazıları sonlu olarak tekrarlanan oyunlarla ilgilidir, diğerleri ise sonsuz tekrarlanan oyunlarla ilgilidir.^[4]

İndirimsiz sonsuz tekrarlanan oyunlar

İskonto edilmemiş modelde oyuncular sabırlıdır. Farklı zaman dilimlerinde hizmet programları arasında ayrım yapmazlar. Bu nedenle, tekrarlanan oyundaki faydaları, temel oyunlardaki yardımcı programların toplamı ile temsil edilir.

Oyun sonsuz olduğunda, sonsuz tekrarlanan oyundaki yardımcı program için ortak bir model, alt sınır ortalama fayda: Eğer oyun bir sonuçla sonuçlanırsa ${ displaystyle x_ {t}}$ , nerede ${ displaystyle x_ {t}}$ oyuncuların yinelemedeki kolektif seçimlerini belirtir t (t = 0,1,2, ...), oyuncu ben's yardımcı programı şu şekilde tanımlanır:

{ displaystyle U_ {i} = liminf _ {T ila infty} { frac {1} {T}} toplamı _ {t = 0} ^ {T} u_ {i} (x_ {t}) ,}

nerede ${ displaystyle u_ {i}}$ oyuncunun temel oyun yardımcı işlevi ben.

İndirimsiz sonsuz tekrarlanan bir oyuna genellikle "süper oyun" denir.

Bu durumda halk teoremi çok basittir ve hiçbir ön koşul içermez: Temel oyundaki her bir bireysel rasyonel ve uygulanabilir getiri profili, tekrarlanan oyunda bir Nash dengesi getiri profilidir.

İspat, a denilen şeyi kullanır acımasız^[5] veya acımasız tetik^[6] strateji. Tüm oyuncular önceden belirlenmiş eylemi oynayarak başlar ve biri sapana kadar bunu yapmaya devam eder. Eğer oyuncu ben saparsa, diğer tüm oyuncular oyuncunun minmaxes olduğu eylemi seçmeye geçer ben sonsuza dek. Sapmadan elde edilen tek aşamalı kazanç, oyuncunun toplam faydasına 0 katkıda bulunur ben. Sapan bir oyuncunun faydası, minmax getirisinden daha yüksek olamaz. Dolayısıyla tüm oyuncular amaçlanan yolda kalırlar ve bu gerçekten bir Nash dengesidir.

Alt oyun mükemmelliği

Yukarıdaki Nash dengesi her zaman değildir alt oyun mükemmel. Cezalandırıcılar için cezalandırma maliyetli ise, cezalandırma tehdidi inandırıcı değildir.

Bir alt oyun mükemmel dengesi biraz daha karmaşık bir strateji gerektirir.^[5]^[7]^:146–149 Ceza sonsuza kadar sürmemelidir; sapmadan elde edilen kazançları silmek için yeterli olan sınırlı bir süre dayanmalıdır. Bundan sonra, diğer oyuncular denge yoluna dönmelidir.

Ortalamanın sınırı kriteri, herhangi bir sınırlı süreli cezanın nihai sonuç üzerinde hiçbir etkisinin olmamasını sağlar. Bu nedenle, sınırlı süreli ceza, alt oyun mükemmel bir dengedir.

Koalisyon alt oyun-mükemmel denge:^[8] Bir dengeye a denir koalisyon Nash dengesi eğer hiçbir koalisyon sapmaktan kazanç sağlayamazsa. A denir koalisyon alt oyun-mükemmel denge eğer hiçbir koalisyon, herhangi bir tarihten sonra sapmaktan kazanç sağlayamazsa.^[9] Gelir profili, koalisyon-Nash dengesinde veya koalisyon-alt-oyun-mükemmel-dengesinde, eğer-ve-sadece-ise, bir getiri profili elde edilebilir. Pareto verimli ve zayıf bir koalisyon bireysel rasyonel.^[10]

Sollama

Bazı yazarlar, ortalamaların sınırı kriterinin gerçekçi olmadığını, çünkü herhangi bir sonlu zaman aralığındaki yardımcı programların toplam faydaya 0 katkıda bulunduğunu ima ettiğini iddia ediyor. Bununla birlikte, herhangi bir sonlu zaman aralığındaki yardımcı programlar pozitif bir değere katkıda bulunursa ve değer indirgenmemişse, sonlu bir sayısal faydayı sonsuz bir sonuç dizisine atfetmek imkansızdır. Bu problemin olası bir çözümü, her sonsuz sonuç dizisi için sayısal bir fayda tanımlamak yerine, sadece iki sonsuz dizi arasındaki tercih ilişkisini tanımlamamızdır. O ajan diyoruz ${ displaystyle i}$ (kesinlikle) sonuçların sırasını tercih eder ${ displaystyle y_ {t}}$ sıra üzerinde ${ displaystyle x_ {t}}$ , Eğer:^[6]^[7]^:139^[8]

{ displaystyle liminf _ {T ila infty} toplamı _ {t = 0} ^ {T} (u_ {i} (y_ {t}) - u_ {i} (x_ {t}))> 0 }

Örneğin, dizileri düşünün ${ displaystyle u_ {i} (x) = (0,0,0,0, ldots)}$ ve ${ displaystyle u_ {i} (y) = (- 1,2,0,0, ldots)}$ . Ortalamanın sınırı kriterine göre, oyunculara aynı faydayı sağlarlar ben, ancak sollama kriterine göre, ${ displaystyle y}$ daha iyi ${ displaystyle x}$ oyuncu için ben. Görmek sollama kriteri daha fazla bilgi için.

Sollama kriterine sahip halk teoremleri, ortalamaların sınırı kriterinden biraz daha zayıftır. Sadece sonuçlar kesinlikle bireysel olarak rasyonel, Nash dengesinde elde edilebilir. Bunun nedeni, eğer bir temsilci saparsa, kısa vadede kazanır ve bu kazanç, ancak ceza saptırıcıya anlaşma yolundan kesinlikle daha az fayda sağladığında silinebilir. Sollama kriteri olarak aşağıdaki halk teoremleri bilinmektedir:

Katı sabit denge:^[6] Nash dengesi denir katı eğer her oyuncu, dengede elde edilen sonsuz sonuç dizisini kesin olarak tercih ederse, sapabileceği diğer herhangi bir sıraya göre. Nash dengesi denir sabit sonuç her zaman diliminde aynı ise. Kesin-durağan-dengede bir sonuç, eğer-ve-sadece-her oyuncu için sonuç kesinlikle oyuncunun minimum sonucundan kesinlikle daha iyiyse elde edilebilir.^[11]
Katı sabit alt oyun mükemmel denge:^[6] Kesin-durağan-alt-oyun-mükemmel-dengede bir sonuç elde edilebilir, eğer her oyuncu için sonuç kesinlikle oyuncunun minimum sonucundan daha iyiyse (bunun "eğer-ve-eğer" sonucu olmadığını unutmayın). Sollama kriteri ile alt oyun mükemmel dengesini elde etmek için, sadece anlaşma yolundan sapan oyuncuyu değil, aynı zamanda sapanı cezalandırmada işbirliği yapmayan her oyuncuyu da cezalandırmak gerekir.^[7]^:149–150
- "Durağan denge" kavramı, sınırlı sayıda sonucun periyodik olarak tekrarlandığı ve bir dönemdeki kazanımın, sonuçlardaki getirilerin aritmetik ortalaması olduğu "periyodik bir denge" olarak genelleştirilebilir. Bu, getirinin kesinlikle minimum getirinin üzerinde olması gerektiği anlamına gelir.^[6]
Katı sabit koalisyon dengesi:^[8] Sollama kriteri ile, koalisyon-Nash-dengesinde bir sonuç elde edilebilirse, o zaman Pareto verimli ve zayıf bir koalisyon bireysel rasyonel. Öte yandan, eğer öyleyse Pareto verimli ve güçlü bir şekilde koalisyon bireysel rasyonel^[12] kesin-durağan-koalisyon-dengesinde elde edilebilir.

İndirimli sonsuz tekrarlanan oyunlar

Sonsuz olarak tekrarlanan bir oyunda bir oyuncunun getirisinin, ortalama indirimli ölçüt indirim faktörü 0 <δ < 1:

{ displaystyle U_ {i} = (1- delta) toplamı _ {t geq 0} delta ^ {t} u_ {i} (x_ {t}),}

İndirim faktörü, oyuncuların ne kadar sabırlı olduğunu gösterir.

Bu durumda halk teoremi, tekrarlanan oyundaki getiri profilinin minmax getiri profiline kesinlikle hakim olmasını gerektirir (yani, her oyuncu kesinlikle minmax getirisinden daha fazlasını alır).

İzin Vermek a Kazanç profili ile sahne oyununun strateji profili olun sen Minmax getiri profiline kesinlikle hakim olan. Oyunun Nash dengesi şu şekilde tanımlanabilir: sen elde edilen getiri profili aşağıdaki gibi:

1. Tüm oyuncular oynayarak başlar a ve oynamaya devam et a sapma olmazsa.

2. Herhangi bir oyuncuysa, oyuncu deyin ben, saptı, strateji profilini oyna m hangi minmaks ben sonsuza dek.

3. Çok taraflı sapmaları göz ardı edin.

Eğer oyuncu ben alır ε Her aşamada 1'i takip ederek minmax getirisinden daha fazla, sonra cezadan kaynaklanan potansiyel kayıp

{ displaystyle { frac {1} {1- delta}} varepsilon.}

Eğer δ 1'e yakınsa, bu sonlu tek aşamalı kazançlardan daha ağır basıyor ve stratejiyi Nash dengesi haline getiriyor.

Bu halk teoreminin alternatif bir ifadesi^[4] denge getiri profiline izin verir sen bireysel olarak rasyonel, uygulanabilir herhangi bir kazanç profili olmak; sadece minmax getiri profiline kesin bir şekilde hakim olan, bireysel olarak rasyonel, uygulanabilir bir getiri profilinin var olmasını gerektirir. Ardından, halk teoremi, yaklaşmanın mümkün olduğunu garanti eder. sen dengede istenen herhangi bir hassasiyete (her biri için) ε Getiri profilinin bir mesafe olduğu bir Nash dengesi vardır ε uzakta sen).

Alt oyun mükemmelliği

Elde etmek alt oyun mükemmel İndirimli oyunlarda denge, iskonto edilmemiş oyunlara göre daha zordur. Cezanın maliyeti ortadan kalkmaz (gelir sınırı kriterinde olduğu gibi). İndirim faktörü gelecekte cezaları çok uzaklarda alakasız kıldığı için cezalandırmayanları sonsuza kadar cezalandırmak her zaman mümkün değildir (sollama kriterinde olduğu gibi) şu an için. Bu nedenle, farklı bir yaklaşıma ihtiyaç vardır: cezalandırıcılar ödüllendirilmelidir.

Bu, ek bir varsayım gerektirir; uygulanabilir getiri profilleri setinin tam boyutlu olduğu ve min-max profilinin iç kısmında yattığıdır. Strateji aşağıdaki gibidir.

1. Tüm oyuncular oynayarak başlar a ve oynamaya devam et a sapma olmazsa.

2. Herhangi bir oyuncuysa, oyuncu deyin ben, saptı, strateji profilini oyna m hangi minmaks ben için N dönemler. (Seç N ve δ yeterince büyük olduğundan hiçbir oyuncunun 1. aşamadan sapma isteği yoktur.)

3. Hiçbir oyuncu 2. aşamadan sapmadıysa, tüm oyuncular j ≠ ben ödüllendirilir ε yukarıda j 's min-max sonsuza kadar, oyuncu iken ben min-max değerini almaya devam ediyor. (Burada tam boyutluluk ve iç varsayıma ihtiyaç vardır.)

4. eğer oyuncu j 2. aşamadan sapıldığında, tüm oyuncular 2. aşamayı yeniden başlatır. j hedef olarak.

5. Çok taraflı sapmaları göz ardı edin.

oyuncu j ≠ ben artık ceza aşaması 2'den sapmak için hiçbir teşviki yok. Bu, alt oyunun mükemmel halk teoremini kanıtlıyor.

Sonlu olarak tekrarlanan oyunlar indirimsiz

Bir oyuncunun getirisinin ben tekrarlanan bir oyunda T zamanlar basit bir aritmetik ortalama ile verilir:

{ displaystyle U_ {i} = { frac {1} {T}} toplamı _ {t = 0} ^ {T} u_ {i} (x_ {t})}

Bu durum için bir halk teoremi aşağıdaki ek gereksinime sahiptir:^[4]

Temel oyunda her oyuncu için benNash dengesi var

{ displaystyle E_ {i}}

bu kesinlikle daha iyi ben, sonra minmax getirisi.

Bu gereksinim, indirimli sonsuz oyun gereksiniminden daha güçlüdür ve bu da indirgenmemiş sonsuz oyun gereksiniminden daha güçlüdür.

Son adımdan dolayı bu gereksinim gereklidir. Son adımda, tek istikrarlı sonuç, temel oyundaki Nash dengesidir. Bir oyuncu varsayalım ben Nash dengesinden hiçbir şey kazanmaz (çünkü ona yalnızca minmax getirisini verir). O halde o oyuncuyu cezalandırmanın bir yolu yok.

Öte yandan, her oyuncu için minmax'tan kesinlikle daha iyi olan temel bir denge varsa, iki aşamada tekrarlanan bir oyun dengesi kurulabilir:

İlk aşamada, oyuncular istenen kazanç profilini yaklaştırmak için gerekli frekanslarda alternatif stratejiler geliştirirler.
Son aşamada, oyuncular sırayla her oyuncunun tercih ettiği dengeyi oynarlar.

Son aşamada, eylemler zaten temel bir oyun dengesi olduğu için hiçbir oyuncu sapmaz. Bir temsilci ilk aşamada saparsa, son aşamada onu en aza indirerek cezalandırılabilir. Oyun yeterince uzunsa, son aşamanın etkisi ihmal edilebilir, bu nedenle denge getirisi istenen profile yaklaşır.

Başvurular

Halk teoremleri çok çeşitli alanlara uygulanabilir. Örneğin:

Antropoloji: tüm davranışların iyi bilindiği ve topluluk üyelerinin birbirleriyle başa çıkmaya devam edeceklerini bildikleri bir toplulukta, o zaman herhangi bir davranış biçimi (gelenekler, tabular, vb.) tarafından sürdürülebilir sosyal normlar Topluluktaki bireylerin topluluk içinde kalmaları, topluluktan ayrılmalarından daha iyi olduğu sürece (asgari sınır koşulu).
Uluslararası siyaset: ülkeler arasındaki anlaşmalar etkili bir şekilde uygulanamaz. Ancak, ülkeler arasındaki ilişkiler uzun vadeli olduğundan ve ülkeler birbirlerine karşı "minimax stratejileri" kullanabildikleri için tutulurlar. Bu olasılık genellikle ilgili ülkelerin indirim faktörüne bağlıdır. Bir ülke çok sabırsızsa (gelecekteki sonuçlara çok az önem veriyorsa), onu cezalandırmak (veya inandırıcı bir şekilde cezalandırmak) zor olabilir.^[5]

Öte yandan, MIT ekonomisti Franklin Fisher halk teoreminin pozitif bir teori olmadığını kaydetmiştir.^[13] Örneğin değerlendirirken, oligopol davranış, halk teoremi iktisatçıya firmaların ne yapacağını söylemez, bunun yerine maliyet ve talep fonksiyonlarının genel bir oligopol teorisi için yeterli olmadığını ve iktisatçıların oligopollerin teorilerinde işledikleri bağlamı dahil etmeleri gerektiğini söyler.^[13]

2007'de Borgs ve ark. halk teoremine rağmen, genel durumda tekrarlanan oyunlar için Nash dengesini hesaplamanın, tek vuruşlu sonlu oyunlar için Nash dengelerini hesaplamaktan daha kolay olmadığını kanıtladı; PPAD karmaşıklık sınıfı.^[14] Bunun pratik sonucu, genel durumda halk teoremlerinin gerektirdiği stratejileri hesaplayan verimli (polinom zaman) algoritmanın bilinmemesidir.

Halk teoremlerinin özeti

Aşağıdaki tablo, çeşitli halk teoremlerini çeşitli yönlerden karşılaştırmaktadır:

Ufuk - sahne oyununun sonsuz veya sonsuz sayıda tekrarlanıp tekrarlanmadığı.
Yardımcı programlar - bir oyuncunun tekrarlanan oyundaki faydasının, oyuncunun sahne oyunu yinelemelerindeki yardımcı programlarından nasıl belirlendiği.
Koşullar G (sahne oyunu) - teoremin çalışması için tek atışlık oyunda olması gereken teknik koşulların olup olmadığı.
Koşullar x (tekrarlanan oyunun hedef getiri vektörü) - teoremin herhangi bir bireysel rasyonel ve uygulanabilir getiri vektörü için mi yoksa yalnızca bu vektörlerin bir alt kümesi üzerinde mi çalıştığı.
Denge türü - tüm koşullar karşılanırsa, teorem tarafından ne tür bir denge garanti edilir - Nash veya Subgame-perfect?
Ceza türü - oyuncuları sapmaktan caydırmak için ne tür bir ceza stratejisi kullanılır?

Tarafından yayınlandı	Ufuk	Araçlar	G'deki koşullar	X üzerindeki koşullar	Garanti	Denge türü	Ceza türü
Benoit ve Krishna^[15]	Sonlu ( ${ displaystyle T}$ )	Aritmetik ortalama	Her oyuncu için minimax'tan kesinlikle daha iyi bir denge getirisi vardır.	Yok	Hepsi için ${ displaystyle varepsilon> 0}$ var ${ displaystyle T_ {0} in mathbb {N}}$ öyle ki, eğer ${ displaystyle T geq T_ {0}}$ her biri için ${ displaystyle x}$ getirili denge var ${ displaystyle varepsilon}$ -yakın ${ displaystyle x}$ .	Nash
Aumann ve Shapley^[5]	Sonsuz	Araçların sınırı	Yok	Yok	Tam olarak ödeme ${ displaystyle x}$ .	Nash	Acımasız
Aumann ve Shapley^[5] ve Rubinstein^[8]^[16]	Sonsuz	Araçların sınırı	Yok	Yok	Tam olarak ödeme ${ displaystyle x}$ .	Alt oyun mükemmel	Sınırlı süreli ceza.^[7]^:146–149
Rubinstein^[6]	Sonsuz	Sollama	Yok	Minimax'ın kesinlikle üzerinde.	Tek sonuç veya periyodik bir sıra.	Alt oyun mükemmel	Cezalandırmayanları cezalandırmak.^[7]^:149–150
Rubinstein^[8]	Sonsuz	Araçların sınırı	Yok	Pareto-verimli ve zayıf-koalisyon-bireysel-rasyonel^[10]	Yok	Koalisyon alt oyun mükemmel
Rubinstein^[8]	Sonsuz	Sollama	Yok	Pareto-verimli ve güçlü bir koalisyon-bireysel-rasyonel^[12]	Yok	Koalisyon-Nash
Fudenberg ve Maskin^[17]	Sonsuz	İndirimli toplam ${ displaystyle delta}$	İlişkili karma stratejilere izin verilir.	Minimax'ın kesinlikle üzerinde.	Ne zaman ${ displaystyle delta}$ 1'e yeterince yakınsa, getirisi tam olarak olan bir denge var ${ displaystyle x}$ .	Nash	Acımasız
Fudenberg ve Maskin^[17]	Sonsuz	İndirimli toplam ${ displaystyle delta}$	Yalnızca saf stratejilere izin verilir.	Minimax'ın kesinlikle üzerinde.	Hepsi için ${ displaystyle varepsilon> 0}$ var ${ displaystyle delta _ {0} <1}$ öyle ki, eğer ${ displaystyle delta geq delta _ {0}}$ her biri için ${ displaystyle x}$ getirisi olan bir denge var ${ displaystyle varepsilon}$ -yakın ${ displaystyle x}$ .	Nash	Acımasız ceza.
Friedman (1971, 1977)	Sonsuz	İndirimli toplam ${ displaystyle delta}$	İlişkili karma stratejilere izin verilir.	G'deki Nash dengesinin kesinlikle üzerinde.	Ne zaman ${ displaystyle delta}$ 1'e yeterince yakın, tam olarak getirisi olan bir denge var ${ displaystyle x}$ .	Alt oyun mükemmel	Nash dengesini kullanan acımasız ceza.
Fudenberg ve Maskin^[17]	Sonsuz	İndirimli toplam ${ displaystyle delta}$	İki oyuncu	Minimax'ın kesinlikle üzerinde.	Hepsi için ${ displaystyle x}$ var ${ displaystyle delta _ {0} <1}$ öyle ki, eğer ${ displaystyle delta geq delta _ {0}}$ tam olarak getirisi olan bir denge var ${ displaystyle x}$ .	Alt oyun mükemmel	Sınırlı süreli ceza.
Fudenberg ve Maskin^[17]	Sonsuz	İndirimli toplam ${ displaystyle delta}$	IR uygulanabilir alan tam boyutludur.^[18]	Minimax'ın kesinlikle üzerinde.	Hepsi için ${ displaystyle x}$ var ${ displaystyle delta _ {0} <1}$ öyle ki, eğer ${ displaystyle delta geq delta _ {0}}$ tam olarak getirisi olan bir denge var ${ displaystyle x}$ .	Alt oyun mükemmel	Cezalandırıcıları ödüllendirmek.^[7]^:150–153

Notlar

^ Matematikte terim halk teoremi genel olarak inanılan ve tartışılan, ancak henüz yayımlanmamış herhangi bir teoremi ifade eder. Roger Myerson, burada tartışılan oyun teorisi teoremleri için daha açıklayıcı bir terim olan "genel fizibilite teoremi" ni önermiştir. Bkz. Myerson, Roger B. Oyun Teorisi, Çatışma Analizi, Cambridge, Harvard University Press (1991)
^ R. Gibbons (1992). Oyun Teorisinde Bir Astar. Biçerdöver Wheatsheaf. s. 89. ISBN 0-7450-1160-8.CS1 Maint: yazar parametresini kullanır (bağlantı)
^ Jonathan Levin (2002). "Pazarlık ve Tekrarlanan Oyunlar" (PDF).
^ ^a ^b ^c Michael Maschler, Eilon Solan & Shmuel Zamir (2013). Oyun Teorisi. Cambridge University Press. s. 176–180. ISBN 978-1-107-00548-8.CS1 Maint: yazar parametresini kullanır (bağlantı)
^ ^a ^b ^c ^d ^e Aumann, Robert J .; Shapley, Lloyd S. (1994). "Uzun Vadeli Rekabet — Bir Oyun Teorik Analizi". Oyun Teorisinde Denemeler. s. 1. doi:10.1007/978-1-4612-2648-2_1. ISBN 978-1-4612-7621-0.
^ ^a ^b ^c ^d ^e ^f Rubinstein, Ariel (1979). "Sollama kriteri ile süper maçlarda denge". İktisat Teorisi Dergisi. 21: 1. doi:10.1016/0022-0531(79)90002-4.
^ ^a ^b ^c ^d ^e ^f . ISBN 0-262-15041-7. LCCN 94008308. OL 1084491M. Eksik veya boş | title = (Yardım)
^ ^a ^b ^c ^d ^e ^f Rubinstein, A. (1980). "Süper oyunlarda güçlü mükemmel denge". Uluslararası Oyun Teorisi Dergisi. 9: 1. doi:10.1007 / BF01784792.
^ Makale, "güçlü denge" terimini kullanıyor. Burada belirsizliği önlemek için "koalisyon dengesi" terimi kullanılmaktadır.
^ ^a ^b Boş olmayan her koalisyon için ${ displaystyle B}$ , diğer oyuncuların bir stratejisi var ( ${ displaystyle N setminus B}$ ) oynadığı herhangi bir strateji için ${ displaystyle B}$ , ödeme ne zaman ${ displaystyle B}$ oyunlar ${ displaystyle c ^ {B}}$ değil [kesinlikle daha iyi herşey üyeleri ${ displaystyle B}$ ].
^ Rubinstein, 1979 tarihli makalesinde, kesin-durağan-dengede bir sonucun her oyuncu için ancak-ve-sadece - elde edilebileceğini iddia ediyor, sonuç oyuncunun minimum sonucundan kesinlikle daha iyi YA DA sonuç diğer herhangi bir sonuçtan zayıf şekilde daha iyi. oyuncu tek taraflı olarak sapabilir. Katı bir dengede ikinci seçeneğin nasıl elde edilebileceği açık değildir. 1994 kitabında bu iddia yer almıyor.
^ ^a ^b boş olmayan her koalisyon için ${ displaystyle B}$ , diğer oyuncuların bir stratejisi var ( ${ displaystyle N setminus B}$ ) oynadığı herhangi bir strateji için ${ displaystyle B}$ getirisi kesinlikle daha kötü en az bir üyesi ${ displaystyle B}$ .
^ ^a ^b Fisher, Franklin M. Oyun Ekonomistleri Oynuyor: İşbirliği Yapılmayan Bir Bakış The RAND Journal of Economics, Cilt. 20, No. 1. (Bahar, 1989), s. 113–124, bu özel tartışma 118. sayfadadır.
^ Christian Borgs; Jennifer Chayes; Nicole Immorlica; Adam Tauman Kalai; Vahab Mirrokni; Christos Papadimitriou (2007). "Halk Teoreminin Efsanesi" (PDF).
^ Benoit, Jean-Pierre; Krishna, Vijay (1985). "Son Olarak Tekrarlanan Oyunlar". Ekonometrik. 53 (4): 905. doi:10.2307/1912660. JSTOR 1912660.
^ Rubinstein, Ariel (1994). "Süper Oyunlarda Denge". Oyun Teorisinde Denemeler. s. 17. doi:10.1007/978-1-4612-2648-2_2. ISBN 978-1-4612-7621-0.
^ ^a ^b ^c ^d Fudenberg, Drew; Maskin, Eric (1986). "İndirimli veya Eksik Bilgili Tekrarlanan Oyunlarda Halk Teoremi". Ekonometrik. 54 (3): 533. CiteSeerX 10.1.1.308.5775. doi:10.2307/1911307. JSTOR 1911307.
^ IR uygulanabilir sonuçlarının bir koleksiyonu var ${ displaystyle y_ {1}, noktalar, y_ {n}}$ , her oyuncu için bir tane olacak şekilde ${ displaystyle i, j}$ , ${ displaystyle x_ {i}> y_ {i, i}}$ ve ${ displaystyle y_ {j, i}> y_ {i, i}}$ .

Referanslar

Friedman, J. (1971). "Süper oyunlar için işbirlikçi olmayan bir denge". Ekonomik Çalışmaların Gözden Geçirilmesi. 38 (1): 1–12. doi:10.2307/2296617. JSTOR 2296617.
Ichiishi, Tatsuro (1997). Mikroekonomi Teorisi. Oxford: Blackwell. s. 263–269. ISBN 1-57718-037-2.
Mas-Colell, A.; Whinston, M .; Green, J. (1995). Mikroekonomi Teorisi. New York: Oxford University Press. ISBN 0-19-507340-1.
Ratliff, J. (1996). "Bir Halk Teoremi Örnekleyici" (PDF). Halk Teoremine bir dizi giriş notu.

[1] Matematikte terim halk teoremi genel olarak inanılan ve tartışılan, ancak henüz yayımlanmamış herhangi bir teoremi ifade eder. Roger Myerson, burada tartışılan oyun teorisi teoremleri için daha açıklayıcı bir terim olan "genel fizibilite teoremi" ni önermiştir. Bkz. Myerson, Roger B. Oyun Teorisi, Çatışma Analizi, Cambridge, Harvard University Press (1991)

[2] R. Gibbons (1992). Oyun Teorisinde Bir Astar. Biçerdöver Wheatsheaf. s. 89. ISBN 0-7450-1160-8.CS1 Maint: yazar parametresini kullanır (bağlantı)

[3] Jonathan Levin (2002). "Pazarlık ve Tekrarlanan Oyunlar" (PDF).

[ZMS-4] Michael Maschler, Eilon Solan & Shmuel Zamir (2013). Oyun Teorisi. Cambridge University Press. s. 176–180. ISBN 978-1-107-00548-8.CS1 Maint: yazar parametresini kullanır (bağlantı)

[AumannShapley94-5] Aumann, Robert J .; Shapley, Lloyd S. (1994). "Uzun Vadeli Rekabet — Bir Oyun Teorik Analizi". Oyun Teorisinde Denemeler. s. 1. doi:10.1007/978-1-4612-2648-2_1. ISBN 978-1-4612-7621-0.

[Rubinstein79-6] ^ ^a ^b ^c ^d ^e ^f Rubinstein, Ariel (1979). "Sollama kriteri ile süper maçlarda denge". İktisat Teorisi Dergisi. 21: 1. doi:10.1016/0022-0531(79)90002-4.

[OR-7] ^ ^a ^b ^c ^d ^e ^f . ISBN 0-262-15041-7. LCCN 94008308. OL 1084491M. Eksik veya boş | title = (Yardım)

[Rubinstein80-8] ^ ^a ^b ^c ^d ^e ^f Rubinstein, A. (1980). "Süper oyunlarda güçlü mükemmel denge". Uluslararası Oyun Teorisi Dergisi. 9: 1. doi:10.1007 / BF01784792.

[9] Makale, "güçlü denge" terimini kullanıyor. Burada belirsizliği önlemek için "koalisyon dengesi" terimi kullanılmaktadır.

[weakly-coalition-individually-rational-10] Boş olmayan her koalisyon için ${ displaystyle B}$ , diğer oyuncuların bir stratejisi var ( ${ displaystyle N setminus B}$ ) oynadığı herhangi bir strateji için ${ displaystyle B}$ , ödeme ne zaman ${ displaystyle B}$ oyunlar ${ displaystyle c ^ {B}}$ değil [kesinlikle daha iyi herşey üyeleri ${ displaystyle B}$ ].

[11] Rubinstein, 1979 tarihli makalesinde, kesin-durağan-dengede bir sonucun her oyuncu için ancak-ve-sadece - elde edilebileceğini iddia ediyor, sonuç oyuncunun minimum sonucundan kesinlikle daha iyi YA DA sonuç diğer herhangi bir sonuçtan zayıf şekilde daha iyi. oyuncu tek taraflı olarak sapabilir. Katı bir dengede ikinci seçeneğin nasıl elde edilebileceği açık değildir. 1994 kitabında bu iddia yer almıyor.

[strongly-coalition-individually-rational-12] ş olmayan her koalisyon için ${ displaystyle B}$ , diğer oyuncuların bir stratejisi var ( ${ displaystyle N setminus B}$ ) oynadığı herhangi bir strateji için ${ displaystyle B}$ getirisi kesinlikle daha kötü en az bir üyesi ${ displaystyle B}$ .

[fisher-13] Fisher, Franklin M. Oyun Ekonomistleri Oynuyor: İşbirliği Yapılmayan Bir Bakış The RAND Journal of Economics, Cilt. 20, No. 1. (Bahar, 1989), s. 113–124, bu özel tartışma 118. sayfadadır.

[14] Christian Borgs; Jennifer Chayes; Nicole Immorlica; Adam Tauman Kalai; Vahab Mirrokni; Christos Papadimitriou (2007). "Halk Teoreminin Efsanesi" (PDF).

[BenoitKrishna85-15] Benoit, Jean-Pierre; Krishna, Vijay (1985). "Son Olarak Tekrarlanan Oyunlar". Ekonometrik. 53 (4): 905. doi:10.2307/1912660. JSTOR 1912660.

[Rubinstein94-16] Rubinstein, Ariel (1994). "Süper Oyunlarda Denge". Oyun Teorisinde Denemeler. s. 17. doi:10.1007/978-1-4612-2648-2_2. ISBN 978-1-4612-7621-0.

[FudenbergMaskin86-17] Fudenberg, Drew; Maskin, Eric (1986). "İndirimli veya Eksik Bilgili Tekrarlanan Oyunlarda Halk Teoremi". Ekonometrik. 54 (3): 533. CiteSeerX 10.1.1.308.5775. doi:10.2307/1911307. JSTOR 1911307.

[18] IR uygulanabilir sonuçlarının bir koleksiyonu var ${ displaystyle y_ {1}, noktalar, y_ {n}}$ , her oyuncu için bir tane olacak şekilde ${ displaystyle i, j}$ , ${ displaystyle x_ {i}> y_ {i, i}}$ ve ${ displaystyle y_ {j, i}> y_ {i, i}}$ .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

Konular oyun Teorisi
Tanımlar	Kooperatif oyun Kararlılık Taahhüdün artması Kapsamlı biçimli oyun Birinci oyuncu ve ikinci oyuncu kazanır Oyun karmaşıklığı Grafik oyun İnanç hiyerarşisi Bilgi seti Normal biçimli oyun Tercih Sıralı oyun Eşzamanlı oyun Eşzamanlı eylem seçimi Çözülmüş oyun Özlü oyun
Denge kavramlar	Nash dengesi Alt oyun mükemmelliği Mertens-kararlı denge Bayesyen Nash dengesi Mükemmel Bayes dengesi Titreyen el Uygun denge Epsilon dengesi İlişkili denge Sıralı denge Yarı mükemmel denge Evrimsel olarak istikrarlı strateji Risk hakimiyeti Çekirdek Shapley değeri Pareto verimliliği Gibbs dengesi Kuantal tepki dengesi Kendini doğrulayan denge Güçlü Nash dengesi Markov mükemmel denge
Stratejiler	Baskın stratejiler Saf strateji Karışık strateji Strateji çalma argümanı Baştankara için tat Acımasız tetik Gizli Anlaşma Geriye dönük İleri indüksiyon Markov stratejisi Teklif gölgelendirme
Sınıflar oyunların	Simetrik oyun Mükemmel bilgi Tekrarlanan oyun Sinyal oyunu Gösterim oyunu Ucuz konuşma Sıfır toplamlı oyun Mekanizma tasarımı Pazarlık sorunu Stokastik oyun Ortalama alan oyunu noyunculu oyun Büyük Poisson oyunu Geçişsiz oyun Küresel oyun Kesinlikle belirlenmiş oyun Potansiyel oyun
Oyunlar	Git Satranç Sonsuz satranç Dama Tic-tac-toe Mahkum ikilemi Hediye alışverişi oyunu İsteğe bağlı mahkum ikilemi Gezginin ikilemi Koordinasyon oyunu Tavuk Kırkayak oyunu Gönüllü ikilemi Dolar müzayedesi Cinsiyetlerin savaşı Geyik avı Eşleşen kuruşlar Ültimatom oyunu Taş kağıt makas Korsan oyunu Diktatör oyunu Kamu malları oyunu Blotto oyunu Yıpratma savaşı El Farol Bar sorunu Adil bölünme Adil kek kesme Cournot oyunu Kilitlenme Diner'in ikilemi Ortalamanın 2 / 3'ünü tahmin et Kuhn poker Nash pazarlık oyunu İndüksiyon bulmacaları Güven oyunu Prenses ve Canavar oyunu Buluşma sorunu
Teoremler	Arrow'un imkansızlık teoremi Aumann'ın anlaşma teoremi Halk teoremi Minimax teoremi Nash teoremi Saflaştırma teoremi Vahiy ilkesi Zermelo teoremi
Anahtar rakamlar	Albert W. Tucker Amos Tversky Antoine Augustin Cournot Ariel Rubinstein Claude Shannon Daniel Kahneman David K. Levine David M. Kreps Donald B. Gillies Drew Fudenberg Eric Maskin Harold W. Kuhn Herbert Simon Hervé Moulin Jean Tirole Jean-François Mertens Jennifer Tour Chayes John Harsanyi John Maynard Smith John Nash John von Neumann Kenneth Arrow Kenneth Binmore Leonid Hurwicz Lloyd Shapley Melvin Dresher Merrill M. Taşkın Olga Bondareva Oskar Morgenstern Paul Milgrom Peyton Young Reinhard Selten Robert Axelrod Robert Aumann Robert B. Wilson Roger Myerson Samuel Bowles Suzanne Scotchmer Thomas Schelling William Vickrey
Ayrıca bakınız	Tüm ödemeli açık artırma Alfa-beta budama Bertrand paradoksu Sınırlı rasyonellik Kombinatoryal oyun teorisi Yüzleşme analizi İşbirliği Evrimsel oyun teorisi Satrançta ilk hamle avantajı Oyun mekaniği Oyun teorisi sözlüğü Oyun teorisyenlerinin listesi Oyun teorisindeki oyunların listesi Kazanmama durumu Satranç çözme Topolojik oyun Müştereklerin trajedisi Küçük kararların tiranlığı