Bayes istatistikleri - Bayesian statistics - Wikipedia

Bayes istatistikleri alanında bir teoridir İstatistik göre Olasılığın Bayes yorumu nerede olasılık ifade eder inanç derecesi içinde Etkinlik. İnanç derecesi, önceki deneylerin sonuçları gibi olay hakkında önceki bilgilere veya olayla ilgili kişisel inançlara dayanabilir. Bu bir dizi diğerinden farklıdır olasılık yorumları, benzeri sık görüşen kimse Olasılığı, limit birçok denemeden sonra bir olayın göreceli sıklığının.^[1]

Bayes istatistiksel yöntemlerin kullanımı Bayes teoremi yeni veriler elde ettikten sonra olasılıkları hesaplamak ve güncellemek için. Bayes teoremi, şartlı olasılık verilere dayalı bir olayın yanı sıra olay veya olayla ilgili koşullar hakkında önceki bilgiler veya inançlar^[2]^[3] Örneğin, Bayesci çıkarım Bayes teoremi, bir nesnenin parametrelerini tahmin etmek için kullanılabilir. olasılık dağılımı veya istatistiksel model. Bayes istatistikleri, olasılığı bir inanç derecesi olarak ele aldığından, Bayes teoremi, inancı parametreye veya parametre setine ölçen bir olasılık dağılımını doğrudan atayabilir.^[1]^[2]

Bayes istatistikleri, Thomas Bayes, Bayes teoreminin belirli bir durumunu formüle eden onun kağıdı 1763'te yayınlandı. 18. yüzyılın sonlarından 19. yüzyılın başlarına kadar uzanan çeşitli makalelerde, Pierre-Simon Laplace Bayesçi olasılık yorumunu geliştirdi.^[4] Laplace, bir dizi istatistiksel problemi çözmek için artık Bayes olarak kabul edilecek yöntemleri kullandı. Daha sonraki yazarlar tarafından birçok Bayes yöntemi geliştirildi, ancak bu terim 1950'lere kadar bu tür yöntemleri tanımlamak için yaygın olarak kullanılmadı. 20. yüzyılın büyük bir bölümünde, Bayesci yöntemler felsefi ve pratik hususlar nedeniyle birçok istatistikçi tarafından olumsuz bir şekilde görüldü. Birçok Bayes yönteminin tamamlanması için çok fazla hesaplama gerekiyordu ve yüzyıl boyunca yaygın olarak kullanılan yöntemlerin çoğu, sıklık yorumuna dayanıyordu. Ancak, güçlü bilgisayarların ve yenilerinin ortaya çıkmasıyla algoritmalar sevmek Markov zinciri Monte Carlo Bayesci yöntemler, 21. yüzyılda istatistiklerde kullanımın arttığını gördü.^[1]^[5]

Bayes teoremi

Bayes teoremi, Bayesci yöntemler tarafından yeni veriler elde edildikten sonra inanç derecesi olan olasılıkları güncellemek için kullanıldığı için Bayes istatistiklerinde temel bir teoremdir. İki olay verildiğinde ${ displaystyle A}$ ve ${ displaystyle B}$ koşullu olasılığı ${ displaystyle A}$ verilen ${ displaystyle B}$ doğru şu şekilde ifade edilir:^[6]

${ displaystyle P (A orta B) = { frac {P (B orta A) P (A)} {P (B)}}}$

nerede ${ displaystyle P (B) neq 0}$ . Bayes teoremi temel bir sonucu olmasına rağmen olasılık teorisi Bayes istatistiklerinde özel bir yorumu vardır. Yukarıdaki denklemde, ${ displaystyle A}$ genellikle bir önerme (zamanın yüzde ellisinde bir bozuk paranın tura düştüğü ifadesi gibi) ve ${ displaystyle B}$ Dikkate alınması gereken kanıtı veya yeni verileri temsil eder (bir dizi yazı tura atmanın sonucu gibi). ${ displaystyle P (A)}$ ... önceki olasılık nın-nin ${ displaystyle A}$ kişinin inançlarını ifade eden ${ displaystyle A}$ kanıt dikkate alınmadan önce. Önceki olasılık aynı zamanda önceki bilgi veya bilgileri nicelleştirebilir. ${ displaystyle A}$ . ${ displaystyle P (B orta A)}$ ... olasılık işlevi, kanıtın olasılığı olarak yorumlanabilir ${ displaystyle B}$ verilen ${ displaystyle A}$ doğru. Olasılık, kanıtların ne ölçüde ${ displaystyle B}$ önermeyi destekler ${ displaystyle A}$ . ${ displaystyle P (A orta B)}$ ... arka olasılık, önermenin olasılığı ${ displaystyle A}$ kanıtı aldıktan sonra ${ displaystyle B}$ hesaba katın. Esasen, Bayes'in teoremi kişinin önceki inançlarını günceller ${ displaystyle P (A)}$ yeni kanıtı değerlendirdikten sonra ${ displaystyle B}$ .^[1]

Kanıtın olasılığı ${ displaystyle P (B)}$ kullanılarak hesaplanabilir toplam olasılık kanunu. Eğer ${ displaystyle {A_ {1}, A_ {2}, noktalar, A_ {n} }}$ bir bölüm of örnek alan, hangisinin setidir sonuçlar bir deneyden sonra,^[1]^[6]

${ displaystyle P (B) = P (B orta A_ {1}) P (A_ {1}) + P (B orta A_ {2}) P (A_ {2}) + noktalar + P (B mid A_ {n}) P (A_ {n}) = toplam _ {i} P (B mid A_ {i}) P (A_ {i})}$

Sonsuz sayıda sonuç olduğunda, birleştirmek tüm sonuçların üzerinde hesaplanacak ${ displaystyle P (B)}$ toplam olasılık yasasını kullanarak. Sıklıkla, ${ displaystyle P (B)}$ Hesaplama, değerlendirilmesi zaman alan toplamları veya integralleri içereceğinden, hesaplanması zordur, bu nedenle, kanıtlar aynı analizde değişmediğinden, çoğu kez yalnızca öncekinin ve olasılığın ürünü dikkate alınır. Arka kısım bu ürünle orantılıdır:^[1]

${ Displaystyle P (A orta B) propto P (B orta A) P (A)}$

maksimum a posteriori, hangisi mod posteriordur ve genellikle Bayes istatistiklerinde hesaplanır. matematiksel optimizasyon yöntemler aynı kalır. Posterior, tam değeri hesaplanmadan bile yaklaşık olarak tahmin edilebilir. ${ displaystyle P (B)}$ Markov zinciri Monte Carlo gibi yöntemlerle veya varyasyonel Bayesci yöntemler.^[1]

Bayes yöntemlerinin ana hatları

Genel istatistiksel teknikler kümesi, birçoğu özel Bayes versiyonlarına sahip olan bir dizi faaliyete bölünebilir.

Bayesci çıkarım

Bayesci çıkarım, istatiksel sonuç çıkarımlarda belirsizliğin olasılık kullanılarak ölçüldüğü yer. Klasik olarak sık görüşlü çıkarım, model parametreleri ve hipotezlerin sabit olduğu kabul edilir. Olasılıklar, sıkça yapılan çıkarımda parametrelere veya hipotezlere atanmaz. Örneğin, sıkça yapılan çıkarımda, adil bir yazı tura atmanın sonucu gibi, yalnızca bir kez gerçekleşebilecek bir olaya doğrudan bir olasılık atamak bir anlam ifade etmeyecektir. Ancak, kafaların oranının yarısına yaklaşır Yazı tura sayısı arttıkça.^[7]

İstatistiksel modeller örnek verilerin nasıl üretildiğini temsil eden bir dizi istatistiksel varsayım ve işlem belirtin. İstatistiksel modellerin değiştirilebilen bir dizi parametresi vardır. Örneğin, bir bozuk para, bir madeni para Bernoulli dağılımı, iki olası sonucu modelleyen. Bernoulli dağılımının tek bir sonucun olasılığına eşit tek bir parametresi vardır, bu çoğu durumda kafaların üzerine düşme olasılığıdır. Veriler için iyi bir model tasarlamak, Bayesci çıkarımın merkezinde yer alır. Çoğu durumda, modeller yalnızca gerçek süreci tahmin eder ve verileri etkileyen belirli faktörleri hesaba katmayabilir.^[1] Bayesci çıkarımda, olasılıklar model parametrelerine atanabilir. Parametreler şu şekilde temsil edilebilir: rastgele değişkenler. Bayesci çıkarım, daha fazla kanıt elde edildikten veya bilindikten sonra olasılıkları güncellemek için Bayes teoremini kullanır.^[1]^[8]

İstatistiksel modelleme

Formülasyonu istatistiksel modeller Bayes istatistiklerinin kullanılması, tanımlayıcı özelliğe sahiptir. önceki dağıtımlar bilinmeyen parametreler için. Aslında, önceki dağıtımların parametrelerinin kendileri önceki dağıtımlara sahip olabilir ve bu da Bayes hiyerarşik modelleme,^[9] veya birbiriyle ilişkili olabilir, Bayes ağları.

Deney tasarımı

Bayes deney tasarımı 'önceki inançların etkisi' olarak adlandırılan bir kavramı içerir. Bu yaklaşım, sıralı analiz önceki deneylerin sonuçlarını sonraki deneyin tasarımına dahil etme teknikleri. Bu, 'inançları' önceki ve arka dağıtım. Bu, deney tasarımının her türden kaynağı iyi kullanmasını sağlar. Buna bir örnek, birden çok slot makinesi sorunu.

Bayes modellerinin keşif analizi

Bayes modellerinin keşif analizi, keşifsel veri analizi Bayes modellemenin ihtiyaç ve özelliklerine yaklaşım. Persi Diaconis'in sözleriyle:^[10]

Keşif amaçlı veri analizi, verilerdeki yapıyı veya basit açıklamaları ortaya çıkarmaya çalışır. Sayılara veya grafiklere bakar ve kalıplar bulmaya çalışırız. Arka plan bilgileri, hayal gücü, algılanan kalıplar ve diğer veri analizleriyle ilgili deneyimler tarafından önerilen ipuçlarını takip ediyoruz.

çıkarım süreci Posterior tahmin dağılımı ve önceki tahmin dağılımı gibi diğer dağılımlarla birlikte Bayes istatistiklerinde merkezi bir role sahip olan bir posterior dağılım üretir. Bu dağılımların doğru görselleştirilmesi, analizi ve yorumlanması, çıkarım sürecini motive eden soruları doğru şekilde cevaplamanın anahtarıdır.^[11]

Bayes modelleriyle çalışırken, çıkarımın yanı sıra ele alınması gereken bir dizi ilgili görev vardır:

Çıkarımın kalitesinin teşhisi, bu gibi sayısal yöntemler kullanılırken gereklidir. Markov zinciri Monte Carlo teknikler
Hem model varsayımlarının hem de model tahminlerinin değerlendirmelerini içeren model eleştirisi
Model seçimi veya model ortalamasını içeren modellerin karşılaştırılması
Belirli bir kitle için sonuçların hazırlanması

Tüm bu görevler, Bayes modellerinin keşif analizi yaklaşımının bir parçasıdır ve bunları başarılı bir şekilde gerçekleştirmek, yinelemeli ve etkileşimli modelleme sürecinin merkezinde yer alır. Bu görevler hem sayısal hem de görsel özetler gerektirir.^[12]^[13]^[14]

Referanslar

^ ^a ^b ^c ^d ^e ^f ^g ^h ^ben Gelman, Andrew; Carlin, John B.; Stern, Hal S .; Dunson, David B .; Vehtari, Aki; Rubin, Donald B. (2013). Bayesian Veri Analizi, Üçüncü Baskı. Chapman ve Hall / CRC. ISBN 978-1-4398-4095-5.
^ ^a ^b McElreath, Richard (2015). İstatistiksel Yeniden Düşünme, Birinci Baskı. Chapman ve Hall / CRC. ISBN 978-1-4822-5344-3.
^ Kruschke, John (2014). Bayesian Veri Analizi Yapmak, İkinci Baskı. Akademik Basın. ISBN 978-0-1240-5888-0.
^ McGrayne, Sharon (2012). Ölmeyecek Teori: Bayes'in Kuralı Enigma Kodunu Nasıl Kırdı, Rus Denizaltılarını Avladı ve İki Yüzyıllık Tartışmadan Muzaffer Ortaya Çıktı, Birinci Baskı. Chapman ve Hall / CRC. ISBN 978-0-3001-8822-6.
^ Fienberg, Stephen E. (2006). "Bayesci Çıkarım Ne Zaman" Bayesçi "Oldu?". Bayes Analizi. 1 (1): 1–40. doi:10.1214 / 06-BA101.
^ ^a ^b Grinstead, Charles M .; Snell, J. Laurie (2006). Olasılığa giriş (2. baskı). Providence, RI: Amerikan Matematik Derneği. ISBN 978-0-8218-9414-9.
^ Wakefield Jon (2013). Bayesçi ve sıklıklı regresyon yöntemleri. New York, NY: Springer. ISBN 978-1-4419-0924-4.
^ Congdon, Peter (2014). Uygulamalı Bayes modelleme (2. baskı). Wiley. ISBN 978-1119951513.
^ Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Yeni nesil dizileme sayım verilerinden kanser alt tip keşfi için Bayesian çoklu alanlı öğrenme. 32. Nöral Bilgi İşleme Sistemleri Konferansı (NIPS 2018), Montréal, Kanada. arXiv:1810.09433
^ Diaconis, Persi (2011) Veri Analizi Teorileri: Büyülü Düşünceden Klasik İstatistiklere Göre. John Wiley & Sons, Ltd 2: e55 10.1002 / 9781118150702.ch1
^ Kumar, Ravin; Carroll, Colin; Hartikainen, Ari; Martin, Osvaldo (2019). "Python'da Bayes modellerinin keşif analizi için birleşik bir kitaplık ArviZ". Açık Kaynak Yazılım Dergisi. 4 (33): 1143. Bibcode:2019JOSS .... 4.1143K. doi:10.21105 / joss.01143.
^ Gabry, Jonah; Simpson, Daniel; Vehtari, Aki; Betancourt, Michael; Gelman, Andrew (2019). "Bayes iş akışında görselleştirme". Kraliyet İstatistik Derneği Dergisi: Seri A (Toplumda İstatistik). 182 (2): 389–402. arXiv:1709.01449. doi:10.1111 / rssa.12378. S2CID 26590874.
^ Vehtari, Aki; Gelman, Andrew; Simpson, Daniel; Carpenter, Bob; Bürkner, Paul-Christian (2019). "Sıra normalleştirme, katlama ve yerelleştirme: MCMC'nin yakınsamasını değerlendirmek için geliştirilmiş bir $ widehat {R} $". arXiv:1903.08008. Alıntı dergisi gerektirir | günlük = (Yardım)
^ Martin, Osvaldo (2018). Python ile Bayes Analizi: PyMC3 ve ArviZ kullanarak istatistiksel modellemeye ve olasılıklı programlamaya giriş. Packt Yayıncılık Ltd. ISBN 9781789341652.

daha fazla okuma

Bayes'i düşünün, Allen B. Downey
Bayes İstatistikleri: Neden ve Nasıl
Puga JL, Krzywinski M, Altman N (Mayıs 2015). "Bayes İstatistikleri". Önemli Noktalar. Doğa Yöntemleri. 12 (5): 377–8. doi:10.1038 / nmeth.3368. PMID 26120626. S2CID 30636134.

Dış bağlantılar

Eliezer S. Yudkowsky. "Bayes Teoreminin Sezgisel Bir Açıklaması" (web sayfası). Alındı 2015-06-15.
Theo Kypraios. "Bayes İstatistiklerinde Nazik Bir Eğitim" (PDF). Alındı 2013-11-03.
Jordi Vallverdu. "Bayesliler ve Sık Kullanılanlara Karşı İstatistiki Akıl Yürütme Üzerine Felsefi Bir Tartışma".
Bayes istatistikleri David Spiegelhalter, Kenneth Rice Scholarpedia 4(8):5230. doi: 10.4249 / alimpedia.5230
Bayes modelleme kitabı ve indirilebilecek örnekler.
Rens Van De Schoot. "Bayes Analize Nazik Bir Giriş" (PDF).
Bayesian A / B Testi Hesaplayıcı Dinamik Verim

[bda-1] ^ ^a ^b ^c ^d ^e ^f ^g ^h ^ben Gelman, Andrew; Carlin, John B.; Stern, Hal S .; Dunson, David B .; Vehtari, Aki; Rubin, Donald B. (2013). Bayesian Veri Analizi, Üçüncü Baskı. Chapman ve Hall / CRC. ISBN 978-1-4398-4095-5.

[rethinking-2] McElreath, Richard (2015). İstatistiksel Yeniden Düşünme, Birinci Baskı. Chapman ve Hall / CRC. ISBN 978-1-4822-5344-3.

[3] Kruschke, John (2014). Bayesian Veri Analizi Yapmak, İkinci Baskı. Akademik Basın. ISBN 978-0-1240-5888-0.

[4] McGrayne, Sharon (2012). Ölmeyecek Teori: Bayes'in Kuralı Enigma Kodunu Nasıl Kırdı, Rus Denizaltılarını Avladı ve İki Yüzyıllık Tartışmadan Muzaffer Ortaya Çıktı, Birinci Baskı. Chapman ve Hall / CRC. ISBN 978-0-3001-8822-6.

[5] Fienberg, Stephen E. (2006). "Bayesci Çıkarım Ne Zaman" Bayesçi "Oldu?". Bayes Analizi. 1 (1): 1–40. doi:10.1214 / 06-BA101.

[grinsteadsnell2006-6] Grinstead, Charles M .; Snell, J. Laurie (2006). Olasılığa giriş (2. baskı). Providence, RI: Amerikan Matematik Derneği. ISBN 978-0-8218-9414-9.

[wakefield2013-7] Wakefield Jon (2013). Bayesçi ve sıklıklı regresyon yöntemleri. New York, NY: Springer. ISBN 978-1-4419-0924-4.

[congdon2014-8] Congdon, Peter (2014). Uygulamalı Bayes modelleme (2. baskı). Wiley. ISBN 978-1119951513.

[:bmdl-9] Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Yeni nesil dizileme sayım verilerinden kanser alt tip keşfi için Bayesian çoklu alanlı öğrenme. 32. Nöral Bilgi İşleme Sistemleri Konferansı (NIPS 2018), Montréal, Kanada. arXiv:1810.09433

[10] Diaconis, Persi (2011) Veri Analizi Teorileri: Büyülü Düşünceden Klasik İstatistiklere Göre. John Wiley & Sons, Ltd 2: e55 10.1002 / 9781118150702.ch1

[11] Kumar, Ravin; Carroll, Colin; Hartikainen, Ari; Martin, Osvaldo (2019). "Python'da Bayes modellerinin keşif analizi için birleşik bir kitaplık ArviZ". Açık Kaynak Yazılım Dergisi. 4 (33): 1143. Bibcode:2019JOSS .... 4.1143K. doi:10.21105 / joss.01143.

[12] Gabry, Jonah; Simpson, Daniel; Vehtari, Aki; Betancourt, Michael; Gelman, Andrew (2019). "Bayes iş akışında görselleştirme". Kraliyet İstatistik Derneği Dergisi: Seri A (Toplumda İstatistik). 182 (2): 389–402. arXiv:1709.01449. doi:10.1111 / rssa.12378. S2CID 26590874.

[13] Vehtari, Aki; Gelman, Andrew; Simpson, Daniel; Carpenter, Bob; Bürkner, Paul-Christian (2019). "Sıra normalleştirme, katlama ve yerelleştirme: MCMC'nin yakınsamasını değerlendirmek için geliştirilmiş bir $ widehat {R} $". arXiv:1903.08008. Alıntı dergisi gerektirir | günlük = (Yardım)

[Martin2018-14] Martin, Osvaldo (2018). Python ile Bayes Analizi: PyMC3 ve ArviZ kullanarak istatistiksel modellemeye ve olasılıklı programlamaya giriş. Packt Yayıncılık Ltd. ISBN 9781789341652.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]