Alt oyun mükemmel dengesi - Subgame perfect equilibrium

Alt Oyun Mükemmel Dengesi
	Bir çözüm kavramı içinde oyun Teorisi
İlişki
Alt kümesi	Nash dengesi
İle kesişir	Evrimsel olarak istikrarlı strateji
Önem
Öneren	Reinhard Selten
İçin kullanılır	Kapsamlı form oyunları
Misal	Ültimatom oyunu

İçinde oyun Teorisi, bir alt oyun mükemmel dengesi (veya alt oyun mükemmel Nash dengesi) bir inceltme bir Nash dengesi kullanılan dinamik oyunlar. Bir strateji profili her birinin Nash dengesini temsil ediyorsa bir alt oyun mükemmel dengesidir. alt oyun orijinal oyunun. Gayri resmi olarak, bu, oyunun herhangi bir noktasında, oyuncuların bu noktadan sonraki davranışlarının, daha önce ne olursa olsun, devam oyununun (yani alt oyunun) Nash dengesini temsil etmesi gerektiği anlamına gelir. Her sınırlı kapsamlı oyun mükemmel hatırlama ile alt oyun mükemmel bir dengeye sahiptir.^[1]

Sonlu bir oyun durumunda alt oyun mükemmel dengesini belirlemek için yaygın bir yöntem, geriye dönük. Burada ilk olarak oyunun son eylemleri değerlendirilir ve son hareket ettirenin her olası durumda kendisini maksimize etmek için hangi eylemleri yapması gerektiğini belirler. Yarar. O halde biri, son oyuncunun bu eylemleri yapacağını varsayar ve ikinciden sonuncuya kadar olan eylemleri yeniden değerlendirerek, yine o oyuncunun faydasını maksimize edenleri seçer. Bu süreç, oyunun ilk hamlesine ulaşılana kadar devam eder. Geriye kalan stratejiler, sonlu ufukta kapsamlı mükemmel bilgi oyunları için tüm alt oyun mükemmel dengelerinin kümesidir.^[1] Ancak, geriye dönük çıkarım aşağıdaki oyunlara uygulanamaz. ben mükemmelim veya eksik bilgi çünkü bu, tekil olmayan kesimi gerektirir bilgi setleri.

Bir alt oyun mükemmel dengesi zorunlu olarak tek seferlik sapma ilkesi.

Belirli bir oyun için alt oyun mükemmel dengesi kümesi, her zaman o oyun için Nash dengesi kümesinin bir alt kümesidir. Bazı durumlarda setler aynı olabilir.

ültimatom oyunu Nash dengesine göre daha az alt oyun mükemmel dengesine sahip bir oyunun sezgisel bir örneğini sunar.

Misal

Geriye dönük çıkarım kullanılarak alt oyun mükemmel dengesinin belirlenmesi Şekil 1'de gösterilmiştir. Oyuncu 1 için stratejiler {Yukarı, Uq, Dp, Dq} ile verilirken, Oyuncu 2'nin stratejileri {TL, TR, BL, BR} arasında yer almaktadır. Bu örnekte 3 uygun alt oyun içeren 4 alt oyun vardır.

Şekil 1

Geriye dönük çıkarımı kullanarak oyuncular her bir alt oyun için aşağıdaki eylemleri gerçekleştirecek:

P ve q eylemleri için alt oyun: Oyuncu 1, Oyuncu 1'in getirisini en üst düzeye çıkarmak için getiri (3, 3) ile p eylemi gerçekleştirecektir, böylece L eyleminin getirisi (3,3) olur.
L ve R eylemleri için alt oyun: Oyuncu 2, 3> 2 için L eylemini gerçekleştirecektir, böylece D eyleminin getirisi (3, 3) olur.
T ve B eylemleri için alt oyun: Oyuncu 2, Oyuncu 2'nin getirisini maksimize etmek için T eylemini gerçekleştirecek, böylece U eyleminin getirisi (1, 4) olur.
U ve D eylemleri için alt oyun: Oyuncu 1, Oyuncu 1'in getirisini maksimize etmek için D eylemini gerçekleştirecektir.

Böylece, alt oyun mükemmel dengesi (3, 3) getirisi olan {Dp, TL} 'dir.

Eksik bilgi içeren kapsamlı bir oyun aşağıda Şekil 2'de sunulmuştur. A ve B eylemlerine sahip Oyuncu 1 düğümünün ve tüm sonraki eylemlerin bir alt oyun olduğuna dikkat edin. Oyuncu 2'nin düğümleri, aynı bilgi kümesinin parçası oldukları için bir alt oyun değildir.

şekil 2

İlk normal biçimli oyun, tüm kapsamlı biçimli oyunun normal biçimli temsilidir. Sağlanan bilgilere göre, (UA, X), (DA, Y) ve (DB, Y) tüm oyun için Nash dengeleridir.

İkinci normal biçimli oyun, Oyuncu 1'in ikinci düğümünden başlayarak A ve B eylemleriyle başlayan alt oyunun normal biçimli temsilidir. İkinci normal biçimli oyun için, alt oyunun Nash dengesi (A, X) 'dir.

Tüm oyun için Nash dengeleri (DA, Y) ve (DB, Y) alt oyun mükemmel dengesi değildir çünkü Oyuncu 2'nin hareketi bir Nash Dengesi oluşturmaz. Nash dengesi (UA, X) alt oyun mükemmeldir çünkü alt oyun Nash dengesini (A, X) stratejisinin bir parçası olarak içerir.^[2]

Bu oyunu çözmek için, önce Alt Oyun 1'in karşılıklı en iyi tepkisine göre Nash Dengesini bulun. Sonra geriye dönük çıkarımı kullanın ve (A, X) → (3,4) yerine takın, böylece (3,4) Alt Oyun 2'nin getirisi olur.^[2]

Kesik çizgi, 2. oyuncunun 1. oyuncunun eşzamanlı bir oyunda A mı yoksa B mi oynayacağını bilmediğini gösterir.

Alt oyun 1 çözülür ve (3,4) tüm Alt Oyun 1'in yerini alır ve birinci oyuncu U -> (3,4) Alt Oyun 1 için Çözüm'ü seçer

Oyuncu 1, Oyuncu 1'in getirisi için 3> 2 olduğu için D yerine U seçer. Ortaya çıkan denge (A, X) → (3,4) 'tür.

Alt Oyun Mükemmel Dengesinin Çözümü

Böylece, geriye dönük tümevarım yoluyla alt-oyun mükemmel dengesi (UA, X) getirili (3, 4) 'tür.

Sonlu olarak tekrarlanan oyunlarda

Sonlu olarak tekrarlanan oyunlar için, eğer bir sahne oyununda yalnızca bir benzersiz Nash dengesi varsa, alt oyun mükemmel dengesi, mevcut alt oyunu tek atışlık bir oyun olarak ele alarak, geçmiş eylemleri dikkate almadan oynamaktır. Bunun bir örneği, sonlu olarak tekrarlanan Mahkum ikilemi oyun. Geriye dönük çıkarım kullanarak, sonlu olarak tekrarlanan bir Mahkum ikilemindeki son alt oyun, oyuncuların benzersiz Nash dengesini oynamasını gerektirir (her iki oyuncu da kaçar). Bu nedenle, son alt oyundan önceki tüm oyunlar, tek dönemlik getirilerini en üst düzeye çıkarmak için Nash dengesini oynayacak.

Sonlu olarak tekrarlanan bir oyundaki bir sahne oyunu birden fazla Nash dengesine sahipse, bir "havuç ve sopa" yapısı aracılığıyla, sahne dışı Nash dengesi eylemlerini oynamak için alt oyun mükemmel dengesi oluşturulabilir. Bir oyuncu, tek aşamalı Nash dengesini Nash dışı denge eylemini oynamayı teşvik etmek için kullanabilirken, diğer oyuncuya daha düşük getirisi olan bir sahne oyunu Nash dengesini kullanırken, kaçmayı seçerse.^[3]

Alt oyun mükemmel dengelerini bulma

Geriye dönük çıkarım çözümünün iyi bilindiği bir oyun tic-tac-toe

Reinhard Selten Ana oyunda mevcut tüm seçeneklerin bir alt kümesini içeren "alt oyunlara" bölünebilen herhangi bir oyunun, alt oyun mükemmel bir Nash Dengesi stratejisine (muhtemelen bir karma strateji deterministik olmayan alt oyun kararları vermek). Alt oyun mükemmelliği yalnızca aşağıdaki oyunlarda kullanılır: tüm bilgiler. Alt oyun mükemmelliği ile kullanılabilir kapsamlı form tam oyunlar ama kusurlu bilgi.

Alt oyun mükemmel Nash dengesi normalde "geriye dönük "oyunun çeşitli nihai sonuçlarından, herhangi bir oyuncunun bir hamle yapmasını gerektirecek dalları ortadan kaldırmak inanılır değil (çünkü optimal olmadığı için) bundan düğüm. Geriye dönük çıkarım çözümünün iyi bilindiği bir oyun tic-tac-toe ama teoride bile Git tüm oyuncular için böyle optimum bir stratejiye sahiptir. Alt oyun mükemmelliği ile geriye dönük çıkarım arasındaki ilişki sorunu, genelleştirilmiş bir geriye dönük çıkarım prosedürünün oyunlarda sonsuz uzunlukta olabilecek tüm alt oyun mükemmel dengelerini ürettiğini kanıtlayan Kaminski (2019) tarafından çözüldü, her bilgi seti olarak sonsuz eylemler ve kusurlu Nihai destek koşulunun karşılanması durumunda bilgi.

Bir önceki paragrafta geçen "inanılır" kelimesinin ilginç yanı, bir bütün olarak ele alındığında (alt oyunlara ulaşmanın geri çevrilemezliğini göz ardı ederek) alt oyun mükemmel stratejilerden daha üstün olan, ancak bir tehdit anlamında inandırıcı olmayan stratejilerin mevcut olmasıdır. bunları uygulamak, tehdit eden oyuncuya zarar verecek ve bu strateji kombinasyonunu engelleyecektir. Örneğin "tavuk "eğer bir oyuncunun direksiyon simidini arabasından sökme seçeneği varsa, her zaman onu almalıdır çünkü bu, rasyonel rakibinin aynı şeyi yapması (ve ikisini de öldürmesi) engellendiği bir" alt oyuna "yol açar. -ripper her zaman oyunu kazanır (rakibini savurarak) ve rakibin uyumu intihar ederek takip etme tehdidi inandırıcı değildir.

Ayrıca bakınız

Referanslar

^ ^a ^b Osborne, M.J. (2004). Oyun Teorisine Giriş. Oxford University Press.
^ ^a ^b Joel., Watson (2013-05-09). Strateji: oyun teorisine giriş (Üçüncü baskı). New York. ISBN 9780393918380. OCLC 842323069.
^ Takako, Fujiwara-Greve. İşbirlikçi olmayan oyun teorisi. Tokyo. ISBN 9784431556442. OCLC 911616270.

Dış bağlantılar

Selten, R. (1965). Spieltheoretische behandlung eines oligopolmodells mit nachfrageträgheit. Zeitschrift für die gesamte Staatswissenschaft / Journal of Institutional and Theoretical Economics, (H.2), 301-324, 667-689. [Almanca'da - Bölüm 1, Bölüm 2 ]
Kusursuz bilgiler içeren Kapsamlı Form Oyunları Örneği
Kapsamlı bir form oyunu için bir alt oyun mükemmel Nash Dengesi çözümü bulmak için Java uygulaması gametheory.net'ten.
Kapsamlı bir form oyunu için bir alt oyun mükemmel Nash Dengesi çözümü bulmak için Java uygulaması gametheory.net'ten.
Kaminski, M.M. Genelleştirilmiş Geriye Doğru Tümevarım: Halk Algoritmasının Gerekçelendirilmesi. Oyunlar 2019, 10, 34.

[Osborne2004-1] Osborne, M.J. (2004). Oyun Teorisine Giriş. Oxford University Press.

[:0-2] Joel., Watson (2013-05-09). Strateji: oyun teorisine giriş (Üçüncü baskı). New York. ISBN 9780393918380. OCLC 842323069.

[3] Takako, Fujiwara-Greve. İşbirlikçi olmayan oyun teorisi. Tokyo. ISBN 9784431556442. OCLC 911616270.

[1]

[2]

[3]

Konular oyun Teorisi
Tanımlar	Kooperatif oyun Kararlılık Taahhüdün artması Kapsamlı form oyunu Birinci oyuncu ve ikinci oyuncu kazanır Oyun karmaşıklığı Grafik oyun İnanç hiyerarşisi Bilgi seti Normal biçimli oyun Tercih Sıralı oyun Eşzamanlı oyun Eşzamanlı eylem seçimi Çözülmüş oyun Özlü oyun
Denge kavramlar	Nash dengesi Alt oyun mükemmelliği Mertens-kararlı denge Bayesyen Nash dengesi Mükemmel Bayes dengesi Titreyen el Uygun denge Epsilon dengesi İlişkili denge Sıralı denge Yarı mükemmel denge Evrimsel olarak istikrarlı strateji Risk hakimiyeti Çekirdek Shapley değeri Pareto verimliliği Gibbs dengesi Kuantal tepki dengesi Kendini doğrulayan denge Güçlü Nash dengesi Markov mükemmel denge
Stratejiler	Baskın stratejiler Saf strateji Karışık strateji Strateji çalma argümanı Baştankara için tat Acımasız tetik Gizli Anlaşma Geriye dönük İleri indüksiyon Markov stratejisi Teklif gölgelendirme
Sınıflar oyunların	Simetrik oyun Mükemmel bilgi Tekrarlanan oyun Sinyal oyunu Gösterim oyunu Ucuz konuşma Sıfır toplamlı oyun Mekanizma tasarımı Pazarlık sorunu Stokastik oyun Ortalama alan oyunu noyunculu oyun Büyük Poisson oyunu Geçişsiz oyun Küresel oyun Kesinlikle belirlenmiş oyun Potansiyel oyun
Oyunlar	Git Satranç Sonsuz satranç Dama Tic-tac-toe Mahkum ikilemi Hediye alışverişi oyunu İsteğe bağlı mahkum ikilemi Gezginin ikilemi Koordinasyon oyunu Tavuk Kırkayak oyunu Gönüllü ikilemi Dolar müzayedesi Cinsiyetlerin savaşı Geyik avı Eşleşen kuruşlar Ültimatom oyunu Taş kağıt makas Korsan oyunu Diktatör oyunu Kamu malları oyunu Blotto oyunu Yıpratma savaşı El Farol Bar sorunu Adil bölünme Adil kek kesme Cournot oyunu Kilitlenme Diner'in ikilemi Ortalamanın 2 / 3'ünü tahmin et Kuhn poker Nash pazarlık oyunu İndüksiyon bulmacaları Güven oyunu Prenses ve Canavar oyunu Buluşma sorunu
Teoremler	Arrow'un imkansızlık teoremi Aumann'ın anlaşma teoremi Halk teoremi Minimax teoremi Nash teoremi Saflaştırma teoremi Vahiy ilkesi Zermelo teoremi
Anahtar rakamlar	Albert W. Tucker Amos Tversky Antoine Augustin Cournot Ariel Rubinstein Claude Shannon Daniel Kahneman David K. Levine David M. Kreps Donald B. Gillies Drew Fudenberg Eric Maskin Harold W. Kuhn Herbert Simon Hervé Moulin Jean Tirole Jean-François Mertens Jennifer Tour Chayes John Harsanyi John Maynard Smith John Nash John von Neumann Kenneth Arrow Kenneth Binmore Leonid Hurwicz Lloyd Shapley Melvin Dresher Merrill M. Taşkın Olga Bondareva Oskar Morgenstern Paul Milgrom Peyton Young Reinhard Selten Robert Axelrod Robert Aumann Robert B. Wilson Roger Myerson Samuel Bowles Suzanne Scotchmer Thomas Schelling William Vickrey
Ayrıca bakınız	Tüm ödemeli açık artırma Alfa-beta budama Bertrand paradoksu Sınırlı rasyonellik Kombinatoryal oyun teorisi Yüzleşme analizi İşbirliği Evrimsel oyun teorisi Satrançta ilk hamle avantajı Oyun mekaniği Oyun teorisi sözlüğü Oyun teorisyenlerinin listesi Oyun teorisindeki oyunların listesi Kazanmama durumu Satranç çözme Topolojik oyun Müştereklerin trajedisi Küçük kararların tiranlığı