Alt oyun mükemmel dengesi - Subgame perfect equilibrium

Alt Oyun Mükemmel Dengesi
Bir çözüm kavramı içinde oyun Teorisi
İlişki
Alt kümesiNash dengesi
İle kesişirEvrimsel olarak istikrarlı strateji
Önem
ÖnerenReinhard Selten
İçin kullanılırKapsamlı form oyunları
MisalÜltimatom oyunu

İçinde oyun Teorisi, bir alt oyun mükemmel dengesi (veya alt oyun mükemmel Nash dengesi) bir inceltme bir Nash dengesi kullanılan dinamik oyunlar. Bir strateji profili her birinin Nash dengesini temsil ediyorsa bir alt oyun mükemmel dengesidir. alt oyun orijinal oyunun. Gayri resmi olarak, bu, oyunun herhangi bir noktasında, oyuncuların bu noktadan sonraki davranışlarının, daha önce ne olursa olsun, devam oyununun (yani alt oyunun) Nash dengesini temsil etmesi gerektiği anlamına gelir. Her sınırlı kapsamlı oyun mükemmel hatırlama ile alt oyun mükemmel bir dengeye sahiptir.[1]

Sonlu bir oyun durumunda alt oyun mükemmel dengesini belirlemek için yaygın bir yöntem, geriye dönük. Burada ilk olarak oyunun son eylemleri değerlendirilir ve son hareket ettirenin her olası durumda kendisini maksimize etmek için hangi eylemleri yapması gerektiğini belirler. Yarar. O halde biri, son oyuncunun bu eylemleri yapacağını varsayar ve ikinciden sonuncuya kadar olan eylemleri yeniden değerlendirerek, yine o oyuncunun faydasını maksimize edenleri seçer. Bu süreç, oyunun ilk hamlesine ulaşılana kadar devam eder. Geriye kalan stratejiler, sonlu ufukta kapsamlı mükemmel bilgi oyunları için tüm alt oyun mükemmel dengelerinin kümesidir.[1] Ancak, geriye dönük çıkarım aşağıdaki oyunlara uygulanamaz. ben mükemmelim veya eksik bilgi çünkü bu, tekil olmayan kesimi gerektirir bilgi setleri.

Bir alt oyun mükemmel dengesi zorunlu olarak tek seferlik sapma ilkesi.

Belirli bir oyun için alt oyun mükemmel dengesi kümesi, her zaman o oyun için Nash dengesi kümesinin bir alt kümesidir. Bazı durumlarda setler aynı olabilir.

ültimatom oyunu Nash dengesine göre daha az alt oyun mükemmel dengesine sahip bir oyunun sezgisel bir örneğini sunar.

Misal

Geriye dönük çıkarım kullanılarak alt oyun mükemmel dengesinin belirlenmesi Şekil 1'de gösterilmiştir. Oyuncu 1 için stratejiler {Yukarı, Uq, Dp, Dq} ile verilirken, Oyuncu 2'nin stratejileri {TL, TR, BL, BR} arasında yer almaktadır. Bu örnekte 3 uygun alt oyun içeren 4 alt oyun vardır.

Şekil 1

Geriye dönük çıkarımı kullanarak oyuncular her bir alt oyun için aşağıdaki eylemleri gerçekleştirecek:

  • P ve q eylemleri için alt oyun: Oyuncu 1, Oyuncu 1'in getirisini en üst düzeye çıkarmak için getiri (3, 3) ile p eylemi gerçekleştirecektir, böylece L eyleminin getirisi (3,3) olur.
  • L ve R eylemleri için alt oyun: Oyuncu 2, 3> 2 için L eylemini gerçekleştirecektir, böylece D eyleminin getirisi (3, 3) olur.
  • T ve B eylemleri için alt oyun: Oyuncu 2, Oyuncu 2'nin getirisini maksimize etmek için T eylemini gerçekleştirecek, böylece U eyleminin getirisi (1, 4) olur.
  • U ve D eylemleri için alt oyun: Oyuncu 1, Oyuncu 1'in getirisini maksimize etmek için D eylemini gerçekleştirecektir.

Böylece, alt oyun mükemmel dengesi (3, 3) getirisi olan {Dp, TL} 'dir.

Eksik bilgi içeren kapsamlı bir oyun aşağıda Şekil 2'de sunulmuştur. A ve B eylemlerine sahip Oyuncu 1 düğümünün ve tüm sonraki eylemlerin bir alt oyun olduğuna dikkat edin. Oyuncu 2'nin düğümleri, aynı bilgi kümesinin parçası oldukları için bir alt oyun değildir.

şekil 2

İlk normal biçimli oyun, tüm kapsamlı biçimli oyunun normal biçimli temsilidir. Sağlanan bilgilere göre, (UA, X), (DA, Y) ve (DB, Y) tüm oyun için Nash dengeleridir.

İkinci normal biçimli oyun, Oyuncu 1'in ikinci düğümünden başlayarak A ve B eylemleriyle başlayan alt oyunun normal biçimli temsilidir. İkinci normal biçimli oyun için, alt oyunun Nash dengesi (A, X) 'dir.

Tüm oyun için Nash dengeleri (DA, Y) ve (DB, Y) alt oyun mükemmel dengesi değildir çünkü Oyuncu 2'nin hareketi bir Nash Dengesi oluşturmaz. Nash dengesi (UA, X) alt oyun mükemmeldir çünkü alt oyun Nash dengesini (A, X) stratejisinin bir parçası olarak içerir.[2]

Bu oyunu çözmek için, önce Alt Oyun 1'in karşılıklı en iyi tepkisine göre Nash Dengesini bulun. Sonra geriye dönük çıkarımı kullanın ve (A, X) → (3,4) yerine takın, böylece (3,4) Alt Oyun 2'nin getirisi olur.[2]

Kesik çizgi, 2. oyuncunun 1. oyuncunun eşzamanlı bir oyunda A mı yoksa B mi oynayacağını bilmediğini gösterir.

Alt oyun 1 çözülür ve (3,4) tüm Alt Oyun 1'in yerini alır ve birinci oyuncu U -> (3,4) Alt Oyun 1 için Çözüm'ü seçer

Oyuncu 1, Oyuncu 1'in getirisi için 3> 2 olduğu için D yerine U seçer. Ortaya çıkan denge (A, X) → (3,4) 'tür.

Alt Oyun Mükemmel Dengesinin Çözümü

Böylece, geriye dönük tümevarım yoluyla alt-oyun mükemmel dengesi (UA, X) getirili (3, 4) 'tür.

Sonlu olarak tekrarlanan oyunlarda

Sonlu olarak tekrarlanan oyunlar için, eğer bir sahne oyununda yalnızca bir benzersiz Nash dengesi varsa, alt oyun mükemmel dengesi, mevcut alt oyunu tek atışlık bir oyun olarak ele alarak, geçmiş eylemleri dikkate almadan oynamaktır. Bunun bir örneği, sonlu olarak tekrarlanan Mahkum ikilemi oyun. Geriye dönük çıkarım kullanarak, sonlu olarak tekrarlanan bir Mahkum ikilemindeki son alt oyun, oyuncuların benzersiz Nash dengesini oynamasını gerektirir (her iki oyuncu da kaçar). Bu nedenle, son alt oyundan önceki tüm oyunlar, tek dönemlik getirilerini en üst düzeye çıkarmak için Nash dengesini oynayacak.

Sonlu olarak tekrarlanan bir oyundaki bir sahne oyunu birden fazla Nash dengesine sahipse, bir "havuç ve sopa" yapısı aracılığıyla, sahne dışı Nash dengesi eylemlerini oynamak için alt oyun mükemmel dengesi oluşturulabilir. Bir oyuncu, tek aşamalı Nash dengesini Nash dışı denge eylemini oynamayı teşvik etmek için kullanabilirken, diğer oyuncuya daha düşük getirisi olan bir sahne oyunu Nash dengesini kullanırken, kaçmayı seçerse.[3]

Alt oyun mükemmel dengelerini bulma

Geriye dönük çıkarım çözümünün iyi bilindiği bir oyun tic-tac-toe

Reinhard Selten Ana oyunda mevcut tüm seçeneklerin bir alt kümesini içeren "alt oyunlara" bölünebilen herhangi bir oyunun, alt oyun mükemmel bir Nash Dengesi stratejisine (muhtemelen bir karma strateji deterministik olmayan alt oyun kararları vermek). Alt oyun mükemmelliği yalnızca aşağıdaki oyunlarda kullanılır: tüm bilgiler. Alt oyun mükemmelliği ile kullanılabilir kapsamlı form tam oyunlar ama kusurlu bilgi.

Alt oyun mükemmel Nash dengesi normalde "geriye dönük "oyunun çeşitli nihai sonuçlarından, herhangi bir oyuncunun bir hamle yapmasını gerektirecek dalları ortadan kaldırmak inanılır değil (çünkü optimal olmadığı için) bundan düğüm. Geriye dönük çıkarım çözümünün iyi bilindiği bir oyun tic-tac-toe ama teoride bile Git tüm oyuncular için böyle optimum bir stratejiye sahiptir. Alt oyun mükemmelliği ile geriye dönük çıkarım arasındaki ilişki sorunu, genelleştirilmiş bir geriye dönük çıkarım prosedürünün oyunlarda sonsuz uzunlukta olabilecek tüm alt oyun mükemmel dengelerini ürettiğini kanıtlayan Kaminski (2019) tarafından çözüldü, her bilgi seti olarak sonsuz eylemler ve kusurlu Nihai destek koşulunun karşılanması durumunda bilgi.

Bir önceki paragrafta geçen "inanılır" kelimesinin ilginç yanı, bir bütün olarak ele alındığında (alt oyunlara ulaşmanın geri çevrilemezliğini göz ardı ederek) alt oyun mükemmel stratejilerden daha üstün olan, ancak bir tehdit anlamında inandırıcı olmayan stratejilerin mevcut olmasıdır. bunları uygulamak, tehdit eden oyuncuya zarar verecek ve bu strateji kombinasyonunu engelleyecektir. Örneğin "tavuk "eğer bir oyuncunun direksiyon simidini arabasından sökme seçeneği varsa, her zaman onu almalıdır çünkü bu, rasyonel rakibinin aynı şeyi yapması (ve ikisini de öldürmesi) engellendiği bir" alt oyuna "yol açar. -ripper her zaman oyunu kazanır (rakibini savurarak) ve rakibin uyumu intihar ederek takip etme tehdidi inandırıcı değildir.

Ayrıca bakınız

Referanslar

  1. ^ a b Osborne, M.J. (2004). Oyun Teorisine Giriş. Oxford University Press.
  2. ^ a b Joel., Watson (2013-05-09). Strateji: oyun teorisine giriş (Üçüncü baskı). New York. ISBN  9780393918380. OCLC  842323069.
  3. ^ Takako, Fujiwara-Greve. İşbirlikçi olmayan oyun teorisi. Tokyo. ISBN  9784431556442. OCLC  911616270.

Dış bağlantılar