Binom testi - Binomial test

İçinde İstatistik, binom testi bir kesin test of İstatistiksel anlamlılık teorik olarak beklenen gözlem dağılımından sapmaların iki kategoriye ayrılması.

Kullanım

Binom testi, hipotezleri test etmek olasılık hakkında ( ${ displaystyle pi}$ ) başarı:

{ displaystyle H_ {0}: pi = pi _ {0}}

nerede ${ displaystyle pi _ {0}}$ 0 ile 1 arasında kullanıcı tanımlı bir değerdir.

Bir örneklemde ise ${ displaystyle n}$ var ${ displaystyle k}$ başarılar, beklerken ${ displaystyle n pi _ {0}}$ , binom dağılımının formülü, bu değeri bulma olasılığını verir:

{ displaystyle Pr (X = k) = { binom {n} {k}} p ^ {k} (1-p) ^ {n-k}}

Eğer ${ displaystyle k$ kümülatif olasılığı bulmamız gerekiyor ${ displaystyle Pr (X leq k)}$ , Eğer ${ displaystyle k> n pi _ {0}}$ ihtiyacımız var ${ displaystyle Pr (X geq k)}$ . ${ displaystyle p}$ -değer daha sonra bu değerin iki katıdır.

Genel kullanım

Binom testinin yaygın bir kullanımı, sıfır hipotezi iki kategorinin eşit derecede oluşma olasılığının (yazı tura atma gibi) olması, boş bir hipotez anlamına gelir ${ displaystyle H_ {0}: pi = 0,5}$ . Bu durum için kategorilerdeki gözlemlerin önemini gösteren tablolar yaygın olarak mevcuttur. Bununla birlikte, aşağıdaki örnekte gösterildiği gibi, binom testi bu durumla sınırlı değildir.

İkiden fazla kategori olduğunda ve kesin bir test gerektiğinde, multinomial test, göre çok terimli dağılım, binom testi yerine kullanılmalıdır.^[1]

Büyük numuneler

Aşağıdaki örnek gibi büyük numuneler için, Binom dağılımı yaklaşık olarak uygun sürekli dağılımlar ve bunlar, hesaplanması çok daha hızlı olan alternatif testler için temel olarak kullanılır, Pearson'un ki-kare testi ve G testi. Bununla birlikte, küçük numuneler için bu yaklaşımlar bozulur ve binom testine alternatif yoktur.

En olağan (ve en kolay) yaklaşım, standart normal dağılımdır. z testi test istatistiği yapılır ${ displaystyle Z}$ , veren

{ displaystyle Z = { frac {k-n pi} { sqrt {n pi (1- pi)}}}}

nerede ${ displaystyle k}$ büyüklükteki bir örneklemde gözlemlenen başarıların sayısıdır ${ displaystyle n}$ ve ${ displaystyle pi}$ boş hipoteze göre başarı olasılığıdır. Bu yaklaşımda bir iyileştirme, bir süreklilik düzeltmesi:

{ displaystyle Z = { frac {k-n pi pm { frac {1} {2}}} { sqrt {n pi (1- pi)}}}}

Çok büyük ${ displaystyle n}$ , bu süreklilik düzeltmesi önemsiz olacaktır, ancak tam iki terimli testin çalışmadığı ara değerler için, önemli ölçüde daha doğru bir sonuç verecektir.

Örnek binom testi

Diyelim ki bir masa oyunu bu tek ruloya bağlıdır ölmek ve a 6'yı yuvarlamaya özel bir önem verir. Belirli bir oyunda, kalıp 235 kez yuvarlanır ve 6, 51 kez gelir. Kalıp adilse, 6'nın gelmesini bekleriz

{ displaystyle 235 times 1/6 = 39,17}

zamanlar. Şimdi gözlemledik ki, kalıp adil olsaydı, 6'ların sayısının ortalamada tamamen şans eseri beklediğimizden daha yüksek olduğunu gördük. Ancak sayı, ölünün adaleti hakkında herhangi bir sonuca varmamız için yeterince yüksek mi? Bu soru, iki terimli test ile cevaplanabilir. bizim sıfır hipotezi kalıbın adil olması (kalıpta çıkan her sayının olasılığı 1 / 6'dır).

Binom testini kullanarak bu soruya bir cevap bulmak için, Binom dağılımı

{ displaystyle B (N = 235, p = 1/6)}

ile pmf

{ displaystyle f (k, n, p) = Pr (k; n, p) = Pr (X = k) = { binom {n} {k}} p ^ {k} (1-p) ^ {nk}}

.

Beklenen değerden daha büyük bir değer gözlemlediğimiz için, sıfırın altında 51 6s veya daha yüksek gözlemleme olasılığını düşünebiliriz, bu da bir tek kuyruklu test (burada temel olarak bu kalıbın beklenenden 6 s üretme eğiliminde olup olmadığını test ediyoruz). Sıfır hipotezi altında 235'lik bir örnekte 51 veya daha fazla 6'nın olasılığını hesaplamak için tam olarak 51 6s, tam olarak 52 6s vb. Elde etme olasılıklarını tam olarak 235 6s alma olasılığına kadar ekliyoruz:

{ displaystyle toplam _ {i = 51} ^ {235} {235 i} p ^ {i} (1-p) ^ {235-i} = 0.02654} seçin

% 5'lik bir önem düzeyine sahipsek, bu sonuç (0,02654 <% 5), kalıbın adil olduğuna dair sıfır hipotezini reddedecek kadar önemli kanıtlara sahip olduğumuzu gösterir.

Normalde, bir kalıbın adilliğini test ederken, kalıbın beklenenden daha az 6s üretmeye eğilimli olup olmadığı ve yukarıdaki tek kuyruklu testte değerlendirdiğimiz gibi sadece 6 saniyeden fazla üretip üretmediğiyle de ilgileniyoruz. Her iki önyargıyı da dikkate almak için bir iki kuyruklu test. Bunu yapmak için, olayın olasılığı 1/2 olmadıkça, tek kuyruklu p değerini ikiye katlayamayacağımızı unutmayın. Bunun nedeni, olasılık 1 / 2'den saptığı için binom dağılımının asimetrik hale gelmesidir. İki kuyruklu p değerini tanımlamanın iki yöntemi vardır. Bir yöntem, beklenen değerden her iki yönde olay sayısındaki toplam sapmanın beklenen değerden daha fazla veya daha az olma olasılığını toplamaktır. Örneğimizde bunun gerçekleşme olasılığı 0.0437'dir. İkinci yöntem, beklenen değerden sapmanın gözlemlenen değerden daha düşük veya daha olası olma olasılığının hesaplanmasını içerir, yani olasılık yoğunluk fonksiyonlarının bir karşılaştırmasından. Bu, ince bir fark yaratabilir, ancak bu örnekte 0,0437 ile aynı olasılığı verir. Her iki durumda da, iki kuyruklu test% 5 düzeyinde anlamlılığı ortaya çıkarır ve bu kalıp için gözlemlenen 6'ların sayısının% 5 düzeyinde beklenen sayıdan önemli ölçüde farklı olduğunu gösterir.

İstatistiksel yazılım paketlerinde

İstatistiksel amaçlarla kullanılan çoğu yazılımda binom testleri mevcuttur. Örneğin.

İçinde R yukarıdaki örnek aşağıdaki kodla hesaplanabilir:
- binom.test(51, 235, 1/6, alternatif = "Daha az") (tek kuyruklu test)
- binom.test(51, 235, 1/6, alternatif = "daha büyük") (tek kuyruklu test)
- binom.test(51, 235, 1/6, alternatif = "iki taraflı") (iki kuyruklu test)

İçinde Java kullanmak Apache Commons kütüphane:
- yeni Binom Testi().iki terimliTest(235, 51, 1.0 / 6, Alternatif hipotez.DAHA AZ) (tek kuyruklu test)
- yeni Binom Testi().iki terimliTest(235, 51, 1.0 / 6, Alternatif hipotez.GREATER_THAN) (tek kuyruklu test)
- yeni Binom Testi().iki terimliTest(235, 51, 1.0 / 6, Alternatif hipotez.TWO_SIDED) (iki kuyruklu test)

İçinde SAS test, Frekans prosedüründe mevcuttur

PROC FREQ DATA = DiceRoll; MASALAR Rulo / BINOMIAL (P =0.166667) ALFA =0.05 ; KESİN BİNOM; AĞIRLIK Frekansı ;KOŞMAK;

İçinde SPSS test menü aracılığıyla kullanılabilir Analiz et > Parametrik olmayan test > Binom
```
 npar testleri / binom (.5) = düğüm1 düğüm2.
```
İçinde Python, kullan SciPy:
- scipy.istatistikler.binom_test(51, 235, 1.0/6, alternatif="daha büyük") (tek kuyruklu test)
- scipy.istatistikler.binom_test(51, 235, 1.0/6, alternatif="iki taraflı") (iki kuyruklu test)
İçinde MATLAB, kullan myBinomTest, Mathworks'ün topluluk File Exchange web sitesi aracılığıyla edinilebilir. myBinomTest, bir başarının varsayılmış olasılığı verilen gözlemler için p değerini doğrudan hesaplayacaktır. [surat asmak]=myBinomTest(51, 235, 1/6) (genellikle iki kuyrukludur, ancak isteğe bağlı olarak tek kuyruklu bir test gerçekleştirebilir).
İçinde Stata bitest'i kullanın.
İçinde Microsoft Excel, Binom.Dist kullanın. İşlev parametreleri alır (Başarı sayısı, Denemeler, Başarı Olasılığı, Kümülatif). "Kümülatif" parametresi, bir mantıksal Doğru veya Yanlış alır; True, bu kadar çok başarıyı (sol kuyruklu bir test) bulma kümülatif olasılığını verir ve False, bu kadar çok başarıyı tam olarak bulma olasılığını verir.

Ayrıca bakınız

p-değer

Referanslar

^ Howell, David C. (2007). Psikoloji için istatistiksel yöntemler (6. baskı). Belmont, Kaliforniya.: Thomson. ISBN 978-0495012870.

"Binom testi". www.graphpad.com.

Dış bağlantılar

[Howell-1] Howell, David C. (2007). Psikoloji için istatistiksel yöntemler (6. baskı). Belmont, Kaliforniya.: Thomson. ISBN 978-0495012870.

[1]