Halk teoremi (oyun teorisi) - Folk theorem (game theory)

İçinde oyun Teorisi, halk teoremleri bolluğunu tanımlayan bir teoremler sınıfıdır Nash dengesi ödeme profilleri tekrarlanan oyunlar (Friedman 1971 ).[1] Orijinal Halk Teoremi, sonsuz tekrarlanan bir oyunun tüm Nash dengelerinin getirileriyle ilgiliydi. Bu sonuç Halk Teoremi olarak adlandırıldı çünkü 1950'lerde oyun teorisyenleri arasında, kimse yayınlamamasına rağmen yaygın olarak biliniyordu. Friedman'ın (1971) Teoremi, belirli alt oyun mükemmel Nash dengesi (SPE) ve böylece orijinal Halk Teoremini daha güçlü bir denge kavramı kullanarak güçlendirir: Nash dengesi yerine alt oyun mükemmel Nash dengesi.[2]

Halk Teoremi, oyuncuların yeterince sabırlı ve ileri görüşlüyse (yani, indirim faktörü ), daha sonra tekrarlanan etkileşim, bir SPE dengesinde hemen hemen her ortalama getiriye neden olabilir.[3] "Hemen hemen her şey" burada teknik olarak "uygulanabilir" ve "bireysel olarak rasyonel" olarak tanımlanır.

Örneğin, tek seferde Mahkum İkilemi, her iki oyuncunun da işbirliği yapması Nash dengesi değildir. Tek Nash dengesi, her iki oyuncunun da kusurlu olmasıdır ki bu aynı zamanda karşılıklı bir minmax profilidir. Bir halk teoremi, oyunun sonsuz tekrarlanan versiyonunda, oyuncuların yeterince sabırlı olması koşuluyla, her iki oyuncunun da denge yolunda işbirliği yapacağı bir Nash dengesi olduğunu söyler. Ancak, oyun yalnızca bilinen sonlu sayıda tekrarlanırsa, geriye dönük çıkarım kullanılarak her iki oyuncunun da her periyotta tek atışlık Nash dengesini oynayacağı, yani her seferinde kaçacakları belirlenebilir.

Kurulum ve tanımlar

İle başlıyoruz temel oyunolarak da bilinir sahne oyunu, hangisi bir n-oyuncu oyunu. Bu oyunda, her oyuncunun aralarından seçim yapabileceği son derece fazla eylem vardır ve seçimlerini aynı anda ve diğer oyuncunun seçimlerini bilmeden yaparlar. Oyuncuların kolektif seçimleri bir getiri profili, yani oyuncuların her biri için bir ödeme. Toplu seçimlerden kazanç profillerine kadar olan eşleştirme oyuncular tarafından bilinir ve her oyuncu getirisini en üst düzeye çıkarmayı amaçlar. Kolektif seçim şu şekilde belirtiliyorsa: x, o oyuncunun getirisi ben oyuncu olarak da bilinen alır ben's Yarar, ile gösterilecek .

Daha sonra bu sahne oyununun sonlu veya sonsuz sayıda tekrarını düşünürüz. Her tekrarda, her oyuncu kendi sahne oyunu seçeneklerinden birini seçer ve bu seçimi yaparken, önceki yinelemelerde diğer oyuncuların seçimlerini de dikkate alabilir. Bu tekrarlanan oyunda strateji Oyunculardan biri için, önceki yinelemelerde diğer tüm oyuncuların seçimlerine dayalı olarak, sahne oyununun her yinelemesinde oyuncunun seçimini belirleyen belirleyici bir kuraldır. Oyuncuların her biri için bir strateji seçimi, strateji profili, ve tekrarlanan oyun için bir ödeme profiline yol açar. Böyle bir strateji profilinin, aşağıda ana hatları verilen bir ödeme profiline dönüştürülmesinin birkaç farklı yolu vardır.

Hiç Nash dengesi Tekrarlanan bir oyunun kazanç profili iki özelliği karşılamalıdır:

1. Bireysel akılcılık: kazanç, kurucu sahne oyununun minmax getiri profiline zayıf bir şekilde hakim olmalıdır. Yani, her bir oyuncunun denge getirisi en az o oyuncunun minimum getirisi kadar büyük olmalıdır. Bunun nedeni, minmax getirisinden daha azını başaran bir oyuncunun her zaman sadece minmax stratejisini her geçmişte oynayarak sapmaya teşvik etmesidir.

2. Fizibilite: getiri bir dışbükey kombinasyon sahne oyununun olası getiri profilleri. Bunun nedeni, tekrarlanan bir oyundaki getirinin, temel oyunlardaki getirilerin sadece ağırlıklı bir ortalaması olmasıdır.

Halk teoremleri kısmen ters iddialardır: belirli koşullar altında (her halk teoreminde farklıdır), derler ki, her Hem bireysel olarak rasyonel hem de uygulanabilir olan getiri profili, tekrarlanan oyunun Nash dengesi getiri profili olarak gerçekleştirilebilir.

Çeşitli halk teoremleri vardır; bazıları sonlu olarak tekrarlanan oyunlarla ilgilidir, diğerleri ise sonsuz tekrarlanan oyunlarla ilgilidir.[4]

İndirimsiz sonsuz tekrarlanan oyunlar

İskonto edilmemiş modelde oyuncular sabırlıdır. Farklı zaman dilimlerinde hizmet programları arasında ayrım yapmazlar. Bu nedenle, tekrarlanan oyundaki faydaları, temel oyunlardaki yardımcı programların toplamı ile temsil edilir.

Oyun sonsuz olduğunda, sonsuz tekrarlanan oyundaki yardımcı program için ortak bir model, alt sınır ortalama fayda: Eğer oyun bir sonuçla sonuçlanırsa , nerede oyuncuların yinelemedeki kolektif seçimlerini belirtir t (t = 0,1,2, ...), oyuncu ben's yardımcı programı şu şekilde tanımlanır:

nerede oyuncunun temel oyun yardımcı işlevi ben.

İndirimsiz sonsuz tekrarlanan bir oyuna genellikle "süper oyun" denir.

Bu durumda halk teoremi çok basittir ve hiçbir ön koşul içermez: Temel oyundaki her bir bireysel rasyonel ve uygulanabilir getiri profili, tekrarlanan oyunda bir Nash dengesi getiri profilidir.

İspat, a denilen şeyi kullanır acımasız[5] veya acımasız tetik[6] strateji. Tüm oyuncular önceden belirlenmiş eylemi oynayarak başlar ve biri sapana kadar bunu yapmaya devam eder. Eğer oyuncu ben saparsa, diğer tüm oyuncular oyuncunun minmaxes olduğu eylemi seçmeye geçer ben sonsuza dek. Sapmadan elde edilen tek aşamalı kazanç, oyuncunun toplam faydasına 0 katkıda bulunur ben. Sapan bir oyuncunun faydası, minmax getirisinden daha yüksek olamaz. Dolayısıyla tüm oyuncular amaçlanan yolda kalırlar ve bu gerçekten bir Nash dengesidir.

Alt oyun mükemmelliği

Yukarıdaki Nash dengesi her zaman değildir alt oyun mükemmel. Cezalandırıcılar için cezalandırma maliyetli ise, cezalandırma tehdidi inandırıcı değildir.

Bir alt oyun mükemmel dengesi biraz daha karmaşık bir strateji gerektirir.[5][7]:146–149 Ceza sonsuza kadar sürmemelidir; sapmadan elde edilen kazançları silmek için yeterli olan sınırlı bir süre dayanmalıdır. Bundan sonra, diğer oyuncular denge yoluna dönmelidir.

Ortalamanın sınırı kriteri, herhangi bir sınırlı süreli cezanın nihai sonuç üzerinde hiçbir etkisinin olmamasını sağlar. Bu nedenle, sınırlı süreli ceza, alt oyun mükemmel bir dengedir.

  • Koalisyon alt oyun-mükemmel denge:[8] Bir dengeye a denir koalisyon Nash dengesi eğer hiçbir koalisyon sapmaktan kazanç sağlayamazsa. A denir koalisyon alt oyun-mükemmel denge eğer hiçbir koalisyon, herhangi bir tarihten sonra sapmaktan kazanç sağlayamazsa.[9] Gelir profili, koalisyon-Nash dengesinde veya koalisyon-alt-oyun-mükemmel-dengesinde, eğer-ve-sadece-ise, bir getiri profili elde edilebilir. Pareto verimli ve zayıf bir koalisyon bireysel rasyonel.[10]

Sollama

Bazı yazarlar, ortalamaların sınırı kriterinin gerçekçi olmadığını, çünkü herhangi bir sonlu zaman aralığındaki yardımcı programların toplam faydaya 0 katkıda bulunduğunu ima ettiğini iddia ediyor. Bununla birlikte, herhangi bir sonlu zaman aralığındaki yardımcı programlar pozitif bir değere katkıda bulunursa ve değer indirgenmemişse, sonlu bir sayısal faydayı sonsuz bir sonuç dizisine atfetmek imkansızdır. Bu problemin olası bir çözümü, her sonsuz sonuç dizisi için sayısal bir fayda tanımlamak yerine, sadece iki sonsuz dizi arasındaki tercih ilişkisini tanımlamamızdır. O ajan diyoruz (kesinlikle) sonuçların sırasını tercih eder sıra üzerinde , Eğer:[6][7]:139[8]

Örneğin, dizileri düşünün ve . Ortalamanın sınırı kriterine göre, oyunculara aynı faydayı sağlarlar ben, ancak sollama kriterine göre, daha iyi oyuncu için ben. Görmek sollama kriteri daha fazla bilgi için.

Sollama kriterine sahip halk teoremleri, ortalamaların sınırı kriterinden biraz daha zayıftır. Sadece sonuçlar kesinlikle bireysel olarak rasyonel, Nash dengesinde elde edilebilir. Bunun nedeni, eğer bir temsilci saparsa, kısa vadede kazanır ve bu kazanç, ancak ceza saptırıcıya anlaşma yolundan kesinlikle daha az fayda sağladığında silinebilir. Sollama kriteri olarak aşağıdaki halk teoremleri bilinmektedir:

  • Katı sabit denge:[6] Nash dengesi denir katı eğer her oyuncu, dengede elde edilen sonsuz sonuç dizisini kesin olarak tercih ederse, sapabileceği diğer herhangi bir sıraya göre. Nash dengesi denir sabit sonuç her zaman diliminde aynı ise. Kesin-durağan-dengede bir sonuç, eğer-ve-sadece-her oyuncu için sonuç kesinlikle oyuncunun minimum sonucundan kesinlikle daha iyiyse elde edilebilir.[11]
  • Katı sabit alt oyun mükemmel denge:[6] Kesin-durağan-alt-oyun-mükemmel-dengede bir sonuç elde edilebilir, eğer her oyuncu için sonuç kesinlikle oyuncunun minimum sonucundan daha iyiyse (bunun "eğer-ve-eğer" sonucu olmadığını unutmayın). Sollama kriteri ile alt oyun mükemmel dengesini elde etmek için, sadece anlaşma yolundan sapan oyuncuyu değil, aynı zamanda sapanı cezalandırmada işbirliği yapmayan her oyuncuyu da cezalandırmak gerekir.[7]:149–150
    • "Durağan denge" kavramı, sınırlı sayıda sonucun periyodik olarak tekrarlandığı ve bir dönemdeki kazanımın, sonuçlardaki getirilerin aritmetik ortalaması olduğu "periyodik bir denge" olarak genelleştirilebilir. Bu, getirinin kesinlikle minimum getirinin üzerinde olması gerektiği anlamına gelir.[6]
  • Katı sabit koalisyon dengesi:[8] Sollama kriteri ile, koalisyon-Nash-dengesinde bir sonuç elde edilebilirse, o zaman Pareto verimli ve zayıf bir koalisyon bireysel rasyonel. Öte yandan, eğer öyleyse Pareto verimli ve güçlü bir şekilde koalisyon bireysel rasyonel[12] kesin-durağan-koalisyon-dengesinde elde edilebilir.

İndirimli sonsuz tekrarlanan oyunlar

Sonsuz olarak tekrarlanan bir oyunda bir oyuncunun getirisinin, ortalama indirimli ölçüt indirim faktörü 0 <δ < 1:

İndirim faktörü, oyuncuların ne kadar sabırlı olduğunu gösterir.

Bu durumda halk teoremi, tekrarlanan oyundaki getiri profilinin minmax getiri profiline kesinlikle hakim olmasını gerektirir (yani, her oyuncu kesinlikle minmax getirisinden daha fazlasını alır).

İzin Vermek a Kazanç profili ile sahne oyununun strateji profili olun sen Minmax getiri profiline kesinlikle hakim olan. Oyunun Nash dengesi şu şekilde tanımlanabilir: sen elde edilen getiri profili aşağıdaki gibi:

1. Tüm oyuncular oynayarak başlar a ve oynamaya devam et a sapma olmazsa.
2. Herhangi bir oyuncuysa, oyuncu deyin ben, saptı, strateji profilini oyna m hangi minmaks ben sonsuza dek.
3. Çok taraflı sapmaları göz ardı edin.

Eğer oyuncu ben alır ε Her aşamada 1'i takip ederek minmax getirisinden daha fazla, sonra cezadan kaynaklanan potansiyel kayıp

Eğer δ 1'e yakınsa, bu sonlu tek aşamalı kazançlardan daha ağır basıyor ve stratejiyi Nash dengesi haline getiriyor.

Bu halk teoreminin alternatif bir ifadesi[4] denge getiri profiline izin verir sen bireysel olarak rasyonel, uygulanabilir herhangi bir kazanç profili olmak; sadece minmax getiri profiline kesin bir şekilde hakim olan, bireysel olarak rasyonel, uygulanabilir bir getiri profilinin var olmasını gerektirir. Ardından, halk teoremi, yaklaşmanın mümkün olduğunu garanti eder. sen dengede istenen herhangi bir hassasiyete (her biri için) ε Getiri profilinin bir mesafe olduğu bir Nash dengesi vardır ε uzakta sen).

Alt oyun mükemmelliği

Elde etmek alt oyun mükemmel İndirimli oyunlarda denge, iskonto edilmemiş oyunlara göre daha zordur. Cezanın maliyeti ortadan kalkmaz (gelir sınırı kriterinde olduğu gibi). İndirim faktörü gelecekte cezaları çok uzaklarda alakasız kıldığı için cezalandırmayanları sonsuza kadar cezalandırmak her zaman mümkün değildir (sollama kriterinde olduğu gibi) şu an için. Bu nedenle, farklı bir yaklaşıma ihtiyaç vardır: cezalandırıcılar ödüllendirilmelidir.

Bu, ek bir varsayım gerektirir; uygulanabilir getiri profilleri setinin tam boyutlu olduğu ve min-max profilinin iç kısmında yattığıdır. Strateji aşağıdaki gibidir.

1. Tüm oyuncular oynayarak başlar a ve oynamaya devam et a sapma olmazsa.
2. Herhangi bir oyuncuysa, oyuncu deyin ben, saptı, strateji profilini oyna m hangi minmaks ben için N dönemler. (Seç N ve δ yeterince büyük olduğundan hiçbir oyuncunun 1. aşamadan sapma isteği yoktur.)
3. Hiçbir oyuncu 2. aşamadan sapmadıysa, tüm oyuncular jben ödüllendirilir ε yukarıda j 's min-max sonsuza kadar, oyuncu iken ben min-max değerini almaya devam ediyor. (Burada tam boyutluluk ve iç varsayıma ihtiyaç vardır.)
4. eğer oyuncu j 2. aşamadan sapıldığında, tüm oyuncular 2. aşamayı yeniden başlatır. j hedef olarak.
5. Çok taraflı sapmaları göz ardı edin.

oyuncu jben artık ceza aşaması 2'den sapmak için hiçbir teşviki yok. Bu, alt oyunun mükemmel halk teoremini kanıtlıyor.

Sonlu olarak tekrarlanan oyunlar indirimsiz

Bir oyuncunun getirisinin ben tekrarlanan bir oyunda T zamanlar basit bir aritmetik ortalama ile verilir:

Bu durum için bir halk teoremi aşağıdaki ek gereksinime sahiptir:[4]

Temel oyunda her oyuncu için benNash dengesi var bu kesinlikle daha iyi ben, sonra minmax getirisi.

Bu gereksinim, indirimli sonsuz oyun gereksiniminden daha güçlüdür ve bu da indirgenmemiş sonsuz oyun gereksiniminden daha güçlüdür.

Son adımdan dolayı bu gereksinim gereklidir. Son adımda, tek istikrarlı sonuç, temel oyundaki Nash dengesidir. Bir oyuncu varsayalım ben Nash dengesinden hiçbir şey kazanmaz (çünkü ona yalnızca minmax getirisini verir). O halde o oyuncuyu cezalandırmanın bir yolu yok.

Öte yandan, her oyuncu için minmax'tan kesinlikle daha iyi olan temel bir denge varsa, iki aşamada tekrarlanan bir oyun dengesi kurulabilir:

  1. İlk aşamada, oyuncular istenen kazanç profilini yaklaştırmak için gerekli frekanslarda alternatif stratejiler geliştirirler.
  2. Son aşamada, oyuncular sırayla her oyuncunun tercih ettiği dengeyi oynarlar.

Son aşamada, eylemler zaten temel bir oyun dengesi olduğu için hiçbir oyuncu sapmaz. Bir temsilci ilk aşamada saparsa, son aşamada onu en aza indirerek cezalandırılabilir. Oyun yeterince uzunsa, son aşamanın etkisi ihmal edilebilir, bu nedenle denge getirisi istenen profile yaklaşır.

Başvurular

Halk teoremleri çok çeşitli alanlara uygulanabilir. Örneğin:

  • Antropoloji: tüm davranışların iyi bilindiği ve topluluk üyelerinin birbirleriyle başa çıkmaya devam edeceklerini bildikleri bir toplulukta, o zaman herhangi bir davranış biçimi (gelenekler, tabular, vb.) tarafından sürdürülebilir sosyal normlar Topluluktaki bireylerin topluluk içinde kalmaları, topluluktan ayrılmalarından daha iyi olduğu sürece (asgari sınır koşulu).
  • Uluslararası siyaset: ülkeler arasındaki anlaşmalar etkili bir şekilde uygulanamaz. Ancak, ülkeler arasındaki ilişkiler uzun vadeli olduğundan ve ülkeler birbirlerine karşı "minimax stratejileri" kullanabildikleri için tutulurlar. Bu olasılık genellikle ilgili ülkelerin indirim faktörüne bağlıdır. Bir ülke çok sabırsızsa (gelecekteki sonuçlara çok az önem veriyorsa), onu cezalandırmak (veya inandırıcı bir şekilde cezalandırmak) zor olabilir.[5]

Öte yandan, MIT ekonomisti Franklin Fisher halk teoreminin pozitif bir teori olmadığını kaydetmiştir.[13] Örneğin değerlendirirken, oligopol davranış, halk teoremi iktisatçıya firmaların ne yapacağını söylemez, bunun yerine maliyet ve talep fonksiyonlarının genel bir oligopol teorisi için yeterli olmadığını ve iktisatçıların oligopollerin teorilerinde işledikleri bağlamı dahil etmeleri gerektiğini söyler.[13]

2007'de Borgs ve ark. halk teoremine rağmen, genel durumda tekrarlanan oyunlar için Nash dengesini hesaplamanın, tek vuruşlu sonlu oyunlar için Nash dengelerini hesaplamaktan daha kolay olmadığını kanıtladı; PPAD karmaşıklık sınıfı.[14] Bunun pratik sonucu, genel durumda halk teoremlerinin gerektirdiği stratejileri hesaplayan verimli (polinom zaman) algoritmanın bilinmemesidir.

Halk teoremlerinin özeti

Aşağıdaki tablo, çeşitli halk teoremlerini çeşitli yönlerden karşılaştırmaktadır:

  • Ufuk - sahne oyununun sonsuz veya sonsuz sayıda tekrarlanıp tekrarlanmadığı.
  • Yardımcı programlar - bir oyuncunun tekrarlanan oyundaki faydasının, oyuncunun sahne oyunu yinelemelerindeki yardımcı programlarından nasıl belirlendiği.
  • Koşullar G (sahne oyunu) - teoremin çalışması için tek atışlık oyunda olması gereken teknik koşulların olup olmadığı.
  • Koşullar x (tekrarlanan oyunun hedef getiri vektörü) - teoremin herhangi bir bireysel rasyonel ve uygulanabilir getiri vektörü için mi yoksa yalnızca bu vektörlerin bir alt kümesi üzerinde mi çalıştığı.
  • Denge türü - tüm koşullar karşılanırsa, teorem tarafından ne tür bir denge garanti edilir - Nash veya Subgame-perfect?
  • Ceza türü - oyuncuları sapmaktan caydırmak için ne tür bir ceza stratejisi kullanılır?
Tarafından yayınlandıUfukAraçlarG'deki koşullarX üzerindeki koşullarGarantiDenge türüCeza türü
Benoit ve Krishna[15]Sonlu ()Aritmetik ortalamaHer oyuncu için minimax'tan kesinlikle daha iyi bir denge getirisi vardır.YokHepsi için var öyle ki, eğer her biri için getirili denge var -yakın .Nash
Aumann ve Shapley[5]SonsuzAraçların sınırıYokYokTam olarak ödeme .NashAcımasız
Aumann ve Shapley[5] ve Rubinstein[8][16]SonsuzAraçların sınırıYokYokTam olarak ödeme .Alt oyun mükemmelSınırlı süreli ceza.[7]:146–149
Rubinstein[6]SonsuzSollamaYokMinimax'ın kesinlikle üzerinde.Tek sonuç veya periyodik bir sıra.Alt oyun mükemmelCezalandırmayanları cezalandırmak.[7]:149–150
Rubinstein[8]SonsuzAraçların sınırıYokPareto-verimli ve zayıf-koalisyon-bireysel-rasyonel[10]YokKoalisyon alt oyun mükemmel
Rubinstein[8]SonsuzSollamaYokPareto-verimli ve güçlü bir koalisyon-bireysel-rasyonel[12]YokKoalisyon-Nash
Fudenberg ve Maskin[17]Sonsuzİndirimli toplam İlişkili karma stratejilere izin verilir.Minimax'ın kesinlikle üzerinde.Ne zaman 1'e yeterince yakınsa, getirisi tam olarak olan bir denge var .NashAcımasız
Fudenberg ve Maskin[17]Sonsuzİndirimli toplam Yalnızca saf stratejilere izin verilir.Minimax'ın kesinlikle üzerinde.Hepsi için var öyle ki, eğer her biri için getirisi olan bir denge var -yakın .NashAcımasız ceza.
Friedman (1971, 1977)Sonsuzİndirimli toplam İlişkili karma stratejilere izin verilir.G'deki Nash dengesinin kesinlikle üzerinde.Ne zaman 1'e yeterince yakın, tam olarak getirisi olan bir denge var .Alt oyun mükemmelNash dengesini kullanan acımasız ceza.
Fudenberg ve Maskin[17]Sonsuzİndirimli toplam İki oyuncuMinimax'ın kesinlikle üzerinde.Hepsi için var öyle ki, eğer tam olarak getirisi olan bir denge var .Alt oyun mükemmelSınırlı süreli ceza.
Fudenberg ve Maskin[17]Sonsuzİndirimli toplam IR uygulanabilir alan tam boyutludur.[18]Minimax'ın kesinlikle üzerinde.Hepsi için var öyle ki, eğer tam olarak getirisi olan bir denge var .Alt oyun mükemmelCezalandırıcıları ödüllendirmek.[7]:150–153

Notlar

  1. ^ Matematikte terim halk teoremi genel olarak inanılan ve tartışılan, ancak henüz yayımlanmamış herhangi bir teoremi ifade eder. Roger Myerson, burada tartışılan oyun teorisi teoremleri için daha açıklayıcı bir terim olan "genel fizibilite teoremi" ni önermiştir. Bkz. Myerson, Roger B. Oyun Teorisi, Çatışma Analizi, Cambridge, Harvard University Press (1991)
  2. ^ R. Gibbons (1992). Oyun Teorisinde Bir Astar. Biçerdöver Wheatsheaf. s. 89. ISBN  0-7450-1160-8.CS1 Maint: yazar parametresini kullanır (bağlantı)
  3. ^ Jonathan Levin (2002). "Pazarlık ve Tekrarlanan Oyunlar" (PDF).
  4. ^ a b c Michael Maschler, Eilon Solan & Shmuel Zamir (2013). Oyun Teorisi. Cambridge University Press. s. 176–180. ISBN  978-1-107-00548-8.CS1 Maint: yazar parametresini kullanır (bağlantı)
  5. ^ a b c d e Aumann, Robert J .; Shapley, Lloyd S. (1994). "Uzun Vadeli Rekabet — Bir Oyun Teorik Analizi". Oyun Teorisinde Denemeler. s. 1. doi:10.1007/978-1-4612-2648-2_1. ISBN  978-1-4612-7621-0.
  6. ^ a b c d e f Rubinstein, Ariel (1979). "Sollama kriteri ile süper maçlarda denge". İktisat Teorisi Dergisi. 21: 1. doi:10.1016/0022-0531(79)90002-4.
  7. ^ a b c d e f . ISBN  0-262-15041-7. LCCN  94008308. OL  1084491M. Eksik veya boş | title = (Yardım)
  8. ^ a b c d e f Rubinstein, A. (1980). "Süper oyunlarda güçlü mükemmel denge". Uluslararası Oyun Teorisi Dergisi. 9: 1. doi:10.1007 / BF01784792.
  9. ^ Makale, "güçlü denge" terimini kullanıyor. Burada belirsizliği önlemek için "koalisyon dengesi" terimi kullanılmaktadır.
  10. ^ a b Boş olmayan her koalisyon için , diğer oyuncuların bir stratejisi var () oynadığı herhangi bir strateji için , ödeme ne zaman oyunlar değil [kesinlikle daha iyi herşey üyeleri ].
  11. ^ Rubinstein, 1979 tarihli makalesinde, kesin-durağan-dengede bir sonucun her oyuncu için ancak-ve-sadece - elde edilebileceğini iddia ediyor, sonuç oyuncunun minimum sonucundan kesinlikle daha iyi YA DA sonuç diğer herhangi bir sonuçtan zayıf şekilde daha iyi. oyuncu tek taraflı olarak sapabilir. Katı bir dengede ikinci seçeneğin nasıl elde edilebileceği açık değildir. 1994 kitabında bu iddia yer almıyor.
  12. ^ a b boş olmayan her koalisyon için , diğer oyuncuların bir stratejisi var () oynadığı herhangi bir strateji için getirisi kesinlikle daha kötü en az bir üyesi .
  13. ^ a b Fisher, Franklin M. Oyun Ekonomistleri Oynuyor: İşbirliği Yapılmayan Bir Bakış The RAND Journal of Economics, Cilt. 20, No. 1. (Bahar, 1989), s. 113–124, bu özel tartışma 118. sayfadadır.
  14. ^ Christian Borgs; Jennifer Chayes; Nicole Immorlica; Adam Tauman Kalai; Vahab Mirrokni; Christos Papadimitriou (2007). "Halk Teoreminin Efsanesi" (PDF).
  15. ^ Benoit, Jean-Pierre; Krishna, Vijay (1985). "Son Olarak Tekrarlanan Oyunlar". Ekonometrik. 53 (4): 905. doi:10.2307/1912660. JSTOR  1912660.
  16. ^ Rubinstein, Ariel (1994). "Süper Oyunlarda Denge". Oyun Teorisinde Denemeler. s. 17. doi:10.1007/978-1-4612-2648-2_2. ISBN  978-1-4612-7621-0.
  17. ^ a b c d Fudenberg, Drew; Maskin, Eric (1986). "İndirimli veya Eksik Bilgili Tekrarlanan Oyunlarda Halk Teoremi". Ekonometrik. 54 (3): 533. CiteSeerX  10.1.1.308.5775. doi:10.2307/1911307. JSTOR  1911307.
  18. ^ IR uygulanabilir sonuçlarının bir koleksiyonu var , her oyuncu için bir tane olacak şekilde , ve .

Referanslar