Binom oranı güven aralığı - Binomial proportion confidence interval

İçinde İstatistik, bir iki terimli orantı güven aralığı bir güven aralığı bir dizi başarı-başarısızlık deneyinin sonucundan hesaplanan başarı olasılığı için (Bernoulli denemeleri ). Başka bir deyişle, iki terimli bir orantılı güven aralığı, bir başarı olasılığının aralık tahminidir. p sadece deney sayısı n ve başarıların sayısı nS bilinmektedir.

İki terimli bir güven aralığı için birkaç formül vardır, ancak hepsi bir varsayımına dayanır. Binom dağılımı. Genel olarak, bir deney belirli sayıda tekrarlandığında, deneyin her denemesinin iki olası sonucu vardır (başarı ve başarısızlık), başarı olasılığı her deneme için aynıdır ve denemeler istatistiksel olarak bağımsız. Binom dağılımı bir ayrık olasılık dağılımı (yani, sürekli değil) ve çok sayıda deneme için hesaplanması zor olan bu güven aralığını hesaplamak için, tümü doğruluk ve hesaplama yoğunluğu açısından kendi ödünleşimleriyle çeşitli tahminler kullanılır.

Basit bir iki terimli dağılım örneği, çeşitli olası sonuçların kümesidir ve bunların olasılıkları, yazı tura atıldı on kere. Gözlemlenen iki terimli oran, dönüşlerin tura olduğu ortaya çıkan fraksiyondur. Gözlenen bu oran göz önüne alındığında, madalyonun tura gelmesinin gerçek olasılığı için güven aralığı, gerçek oranı içerebilen veya içermeyen olası bir oran aralığıdır. Örneğin, oran için% 95 güven aralığı, güven aralığı oluşturma prosedürünün kullanıldığı zamanların gerçek oranının% 95'ini içerecektir.[1]

Normal yaklaşım aralığı

Bir binom güven aralığı için yaygın olarak kullanılan bir formül, binomiyal olarak dağıtılmış bir gözlemle ilgili hata dağılımını yaklaşık olarak belirlemeye dayanır , Birlikte normal dağılım.[2] Bu yaklaşım, Merkezi Limit Teoremi ve örneklem büyüklüğü küçük olduğunda veya başarı olasılığı 0 veya 1'e yakın olduğunda güvenilmezdir.[3]

Normal yaklaşımı kullanarak, başarı olasılığı p olarak tahmin edilmektedir

veya eşdeğeri

nerede bir içindeki başarı oranı Bernoulli deneme ile ölçülen süreç sonuç veren denemeler başarılar ve başarısızlıklar ve ... çeyreklik bir standart normal dağılım (yani probit ) hedef hata oranına karşılık gelir . % 95 güven düzeyi için hata , yani ve .

Bu güven aralığının önemli bir teorik türetilmesi, bir hipotez testinin tersine çevrilmesini içerir. Bu formülasyon altında, güven aralığı, popülasyon parametresinin büyük olan değerlerini temsil eder. p- Varsayılmış olarak test edildiyse değerler nüfus oranı. Değerlerin toplanması, normal yaklaşımın geçerli olduğu şu şekilde temsil edilebilir:

nerede ... çeyreklik bir standart normal dağılım. Eşitsizliğin ortasındaki test bir Wald testi normal yaklaşım aralığı bazen Wald aralığı, ancak ilk olarak tanımlanmıştır Pierre-Simon Laplace 1812'de.[4]

Ağırlıklı verileri kullanırken bir orantı tahmininin standart hatası

Basit bir rastgele örnek olalım her biri nerede dır-dir i.i.d bir Bernoulli (p) dağılım ve ağırlık her gözlemin ağırlığıdır. (Pozitif) ağırlıkları standartlaştırın yani toplamları 1'e eşittir. ağırlıklı numune oranı dır-dir: . Beri bağımsızdır ve her birinin varyansı vardır , oranın örnekleme varyansı bu nedenle:[5]

.

standart hata nın-nin bu miktarın kareköküdür. Çünkü bilmiyoruz , bunu tahmin etmeliyiz. Pek çok olası tahminci olmasına rağmen, geleneksel olanı kullanmaktır , örnek ortalamadır ve bunu formüle ekleyin. Bu verir:

Ağırlıksız veriler için, , veren . SE olur , ağırlıklı veriler için hesaplamanın bunların doğrudan bir genellemesi olduğunu gösteren tanıdık formüllere götürür.

Wilson skor aralığı

Wilson skor aralığı, normal yaklaşım aralığına göre bir gelişmedir. kapsama olasılığı nominal değere daha yakındır. Tarafından geliştirilmiştir Edwin Bidwell Wilson (1927).[6]

Wilson, iki terimliye normal yaklaşımla başladı:

örnek standart sapmanın analitik formülü ile

.

İkisini birleştirmek ve radikalin karesini almak, içinde ikinci dereceden bir denklem verir. p:

İlişkiyi standart formda ikinci dereceden bir denkleme dönüştürmek p, tedavi ve n numuneden bilinen değerler olarak (önceki bölüme bakın) ve değeri kullanılarak z tahmini için istenen güvenliliğe karşılık gelen p bunu verir:

,

burada parantez içindeki tüm değerler bilinen miktarlardır. için çözüm p için güven aralığının üst ve alt sınırlarını tahmin eder p. Dolayısıyla başarı olasılığı p tarafından tahmin edilmektedir

veya eşdeğeri

Bu aralığı kullanmanın pratik gözlemi, az sayıda deneme ve / veya aşırı bir olasılık için bile iyi özelliklere sahip olmasıdır.

Sezgisel olarak, bu aralığın merkez değeri şunun ağırlıklı ortalamasıdır: ve , ile örneklem büyüklüğü arttıkça daha fazla ağırlık alma. Resmi olarak, merkez değeri bir sahte hesap nın-nin 1/2 z², güven aralığının standart sapma sayısı: oran tahminini elde etmek için bu sayıyı hem başarıların hem de başarısızlıkların sayısına ekleyin. Her bir yön aralığındaki ortak iki standart sapma için (yaklaşık% 95 kapsama, ki bu da yaklaşık 1,96 standart sapmadır), bu, tahmini verir , "artı dört kuralı" olarak bilinir.

İkinci dereceden açıkça çözülebilmesine rağmen, çoğu durumda Wilson denklemleri sabit nokta iterasyonu kullanılarak sayısal olarak da çözülebilir.

ile .

Wilson aralığı şunlardan türetilebilir: Pearson'un ki-kare testi iki kategori ile. Ortaya çıkan aralık,

daha sonra çözülebilir Wilson skor aralığını oluşturmak için. Eşitsizliğin ortasındaki test bir puan testi.

Süreklilik düzeltmeli Wilson skor aralığı

Wilson aralığı, bir süreklilik düzeltmesi minimum hizalamak için kapsama olasılığı, ortalama olasılık yerine, nominal değerle.

Wilson aralığı aynaları gibi Pearson'un ki-kare testi süreklilik düzeltmeli Wilson aralığı eşdeğerini yansıtır Yates'in ki-kare testi.

Süreklilik düzeltmeli Wilson skor aralığının alt ve üst sınırları için aşağıdaki formüller Newcombe (1998) 'den türetilmiştir.[7]

Ancak, eğer p = 0, 0 olarak alınmalıdır; Eğer p = 1, 1'dir.

Jeffreys aralığı

Jeffreys aralığı Bayes bir türevi vardır, ancak iyi sıklık özellikleri vardır. Özellikle Wilson aralığındakilere benzer kapsama özelliklerine sahiptir, ancak olma avantajıyla birkaç aralıktan biridir. eşit kuyruklu (örneğin,% 95 güven aralığı için, aralığın gerçek değerin üstünde veya altında yatan olasılıklarının her ikisi de% 2,5'e yakındır). Aksine, Wilson aralığı, merkeze çok yakın olacak şekilde sistematik bir önyargıya sahiptir. p = 0.5.[8]

Jeffreys aralığı Bayesian güvenilir aralık kullanılırken elde edilen bilgilendirici olmayan Jeffreys önceden iki terimli oran için p. Jeffreys bu sorundan önce bir Beta dağılımı parametrelerle (1/2, 1/2), bu bir önceki eşlenik. Gözlemledikten sonra x başarılar n denemeler, arka dağıtım için p parametreli bir Beta dağılımıdır (x + 1/2, n – x + 1/2).

Ne zaman x ≠0 ve x ≠ n, Jeffreys aralığı, 100(1 – α)% eşit kuyruklu posterior olasılık aralığı, yani α / 2 ve 1 – α / 2 Parametreli bir Beta dağılımının miktarları (x + 1/2, n – x + 1/2). Bu niceliklerin sayısal olarak hesaplanması gerekir, ancak bu modern istatistiksel yazılımla oldukça basittir.

Kapsama olasılığının sıfıra düşmesini önlemek için p → 0 veya 1, ne zaman x = 0 üst sınır önceden olduğu gibi hesaplanır, ancak alt sınır 0 olarak ayarlanır ve x = n alt sınır önceden olduğu gibi hesaplanır, ancak üst sınır 1 olarak ayarlanır.[3]

Clopper – Pearson aralığı

Clopper – Pearson aralığı, iki terimli güven aralıklarını hesaplamak için erken ve çok yaygın bir yöntemdir.[9] Bu genellikle 'kesin' yöntem olarak adlandırılır, çünkü bu, iki terimli dağılımın kümülatif olasılıklarına dayanır (yani, bir tahmin yerine tam olarak doğru dağılım). Bununla birlikte, popülasyon büyüklüğünü bildiğimiz durumlarda, aralıklar mümkün olan en küçük olmayabilir. Örneğin, gerçek oranı% 50 olan 20 büyüklüğündeki bir popülasyon için Clopper-Pearson, 0.456 genişliğe sahip olan [0.272, 0.728] değerini verir (ve sınırlar, 6/20 ve 14 olan "sonraki ulaşılabilir değerlerden" 0.0280 uzakta) / 20); Wilson ise 0.401 genişliğe sahip olan [0.299, 0.701] değerini verir (ve sonraki ulaşılabilir değerlerden 0.0007 uzakta).

Clopper – Pearson aralığı şu şekilde yazılabilir:

Veya eşdeğer olarak,

ile

nerede 0 ≤ xn örneklemde ve Kutudaki başarıların sayısıdır (nθ) iki terimli rastgele bir değişkendir n denemeler ve başarı olasılığıθ.

Eşdeğer olarak Clopper – Pearson aralığının şöyle olduğunu söyleyebiliriz güven seviyesi ile Eğer aşağıdaki hipotez testlerinin anlamlı bir şekilde başarılı olmasını sağlayacak olanların sonsuzudur :

  1. H0: H ileBir:
  2. H0: H ileBir: .

Binom dağılımı ile beta dağılımı, Clopper – Pearson aralığı bazen beta dağılımındaki nicelikleri kullanan alternatif bir formatta sunulur.

nerede x başarıların sayısı, n deneme sayısıdır ve B(p; v,w) pinci çeyreklik şekil parametreleri içeren bir beta dağılımından v ve w.

Ne zaman ya veya , aralık sınırları için kapalı formlu ifadeler mevcuttur: ne zaman aralık ve ne zaman bu .[10]

Beta dağılımı, sırayla, F dağılımı bu nedenle Clopper-Pearson aralığının üçüncü bir formülasyonu F nicelikleri kullanılarak yazılabilir:

nerede x başarıların sayısı, n deneme sayısıdır ve F(c; d1, d2) c ile bir F dağılımından kuantil d1 ve d2 özgürlük derecesi.[11]

Clopper-Pearson aralığı, binom dağılımına herhangi bir yaklaşımdan ziyade doğrudan binom dağılımına dayandığından tam bir aralıktır. Bu aralık hiçbir zaman herhangi bir nüfus oranı için nominal kapsamdan daha azına sahip değildir, ancak bu genellikle muhafazakar olduğu anlamına gelir. Örneğin,% 95 Clopper-Pearson aralığının gerçek kapsama oranı, şuna bağlı olarak% 95'in oldukça üzerinde olabilir. n veθ.[3] Bu nedenle aralık,% 95 güvene ulaşmak için gerekenden daha geniş olabilir. Buna karşılık, diğer güven sınırlarının nominal güven genişliklerinden daha dar olabileceğine dikkat çekmek önemlidir, yani normal yaklaşım (veya "standart") aralığı, Wilson aralığı,[6] Agresti – Coull aralığı,[11] vb., nominal kapsama oranı% 95 ile gerçekte% 95'ten daha azını kapsayabilir.[3]

Clopper-Pearson aralığının tanımı, farklı dağılımlar için kesin güven aralıkları elde etmek için de değiştirilebilir. Örneğin, iki terimli bir dağılımın tekrarlanan çizimleri yerine, numunelerin bilinen büyüklükteki bir popülasyondan değiştirilmeden çekildiği duruma da uygulanabilir. Bu durumda, temel dağıtım, hipergeometrik dağılım.

Agresti – Coull aralığı

Agresti – Coull aralığı da başka bir yaklaşık iki terimli güven aralığıdır.[11]

Verilen başarılar denemeler, tanımla

ve

Ardından, bir güven aralığı tarafından verilir

nerede daha önce olduğu gibi standart bir normal dağılımın nicelikidir (örneğin,% 95 güven aralığı gerektirir , böylece üretiyor ). Göre Kahverengi, Cai ve DasGupta,[3] alma 1,96 yerine, daha önce açıklanan "2 başarı ve 2 başarısızlık ekle" aralığını üretir Agresti ve Coull.[11]

Bu aralık, merkez noktası ayarlaması kullanılarak özetlenebilir, , Wilson skor aralığının ve ardından Normal yaklaşımın bu noktaya uygulanması.[2][3]

Ark dönüşümü

Arkin dönüşümü, dağıtımın uçlarını dışarı çekme etkisine sahiptir.[12] Orantı verilerinin varyansını (ve dolayısıyla güven aralıklarını) stabilize edebilmesine rağmen, kullanımı çeşitli bağlamlarda eleştirilmiştir.[13]

İzin Vermek X başarıların sayısı olmak n denemeler ve izin p = X/n. Varyansı p dır-dir

Ark sinüsünü kullanarak ark sinüsünün varyansını dönüştürün. p1/2 dır-dir[14]

Dolayısıyla, güven aralığının kendisi aşağıdaki biçime sahiptir:

nerede ... standart normal dağılımın niceliği.

Bu yöntem, varyansını tahmin etmek için kullanılabilir p ama kullanımı sorunludur p 0 veya 1'e yakın.

ta dönüştürmek

İzin Vermek p başarıların oranı olabilir. 0 ≤ için a ≤ 2,

Bu aile, logit dönüşümünün bir genellemesidir ve özel bir durumdur. a = 1 ve orantılı bir veri dağıtımını yaklaşık olarak normal dağılım. Parametre a veri seti için tahmin edilmesi gerekir.

Üç kuralı - hiçbir başarı gözlenmediğinde

üç kural için yaklaşık% 95 güven aralığı belirtmenin basit bir yolunu sağlamak için kullanılır pBaşarının olmadığı özel durumda () gözlemlenmiştir.[15] Aralık (0,3/n).

Simetri ile, yalnızca başarılar beklenebilir (), aralık (1 − 3/n,1).

Farklı aralıkların karşılaştırılması

Binom oranı için bunları ve diğer güven aralıklarını karşılaştıran birkaç araştırma makalesi vardır.[2][7][16][17] Agresti ve Coull (1998)[11] ve Ross (2003)[18] Clopper – Pearson aralığı gibi kesin yöntemlerin belirli tahminler kadar işe yaramayabileceğini işaret edin. Normal yaklaşım ve ders kitaplarındaki sunumu eleştirildi, birçok istatistikçi bunun kullanılmamasını savunuyor.[3]

Yukarıda listelenen yaklaşımlardan Wilson skor aralığı yöntemlerinin (süreklilik düzeltmeli veya düzeltmesiz) en doğru ve en sağlam olduğu gösterilmiştir.[2][3][7] ancak bazıları daha büyük numune boyutları için Agresti – Coull yaklaşımını tercih etmektedir.[3]

Bu aralıkların çoğu şu şekilde hesaplanabilir: R gibi paketleri kullanmak "binom" veya içinde Python paketi kullanmak "ebcic" (Tam Binom Güven Aralığı Hesaplayıcı).

Ayrıca bakınız

Referanslar

  1. ^ Sullivan, Lisa (2017-10-27). "Güvenilirlik aralığı". Boston Üniversitesi Halk Sağlığı Okulu.
  2. ^ a b c d Wallis, Sean A. (2013). "Binom güven aralıkları ve acil durum testleri: matematiksel temeller ve alternatif yöntemlerin değerlendirilmesi" (PDF). Nicel Dilbilim Dergisi. 20 (3): 178–208. doi:10.1080/09296174.2013.799918. S2CID  16741749.
  3. ^ a b c d e f g h ben Kahverengi, Lawrence D.; Cai, T. Tony; DasGupta, Anirban (2001). "Bir Binom Oranının Aralık Tahmini". İstatistik Bilimi. 16 (2): 101–133. CiteSeerX  10.1.1.50.3025. doi:10.1214 / ss / 1009213286. BAY  1861069. Zbl  1059.62533.
  4. ^ Laplace, Pierre Simon (1812). Théorie analytique des probabilités (Fransızcada). Ve. Courcier. s. 283.
  5. ^ Ağırlıklı verileri kullanarak bir oranın standart hatası nasıl hesaplanır?
  6. ^ a b Wilson, E. B. (1927). "Muhtemel çıkarım, veraset yasası ve istatistiksel çıkarım". Amerikan İstatistik Derneği Dergisi. 22 (158): 209–212. doi:10.1080/01621459.1927.10502953. JSTOR  2276774.
  7. ^ a b c Newcombe, R.G. (1998). "Tek oran için iki taraflı güven aralıkları: yedi yöntemin karşılaştırması". Tıpta İstatistik. 17 (8): 857–872. doi:10.1002 / (SICI) 1097-0258 (19980430) 17: 8 <857 :: AID-SIM777> 3.0.CO; 2-E. PMID  9595616.
  8. ^ Cai, TT (2005). "Ayrık dağılımlarda tek taraflı güven aralıkları". İstatistiksel Planlama ve Çıkarım Dergisi. 131 (1): 63–88. doi:10.1016 / j.jspi.2004.01.005.
  9. ^ Clopper, C .; Pearson, E. S. (1934). "İki terimli durumunda gösterilen güven veya itibari sınırların kullanımı". Biometrika. 26 (4): 404–413. doi:10.1093 / biomet / 26.4.404.
  10. ^ Thulin, Måns (2014-01-01). "İki terimli bir oran için kesin güven aralıklarını kullanmanın maliyeti". Elektronik İstatistik Dergisi. 8 (1): 817–840. arXiv:1303.1288. doi:10.1214 / 14-EJS909. ISSN  1935-7524. S2CID  88519382.
  11. ^ a b c d e Agresti, Alan; Coull, Brent A. (1998). "Yaklaşık, iki terimli oranların aralık tahmini için" kesin "den daha iyidir". Amerikan İstatistikçi. 52 (2): 119–126. doi:10.2307/2685469. JSTOR  2685469. BAY  1628435.
  12. ^ Hollanda, Steven. "Oranların ve yüzdelerin dönüşümleri". strata.uga.edu. Alındı 2020-09-08.
  13. ^ Warton, David I .; Hui, Francis K. C. (Ocak 2011). "Ark sinüs asindir: ekolojideki oranların analizi". Ekoloji. 92 (1): 3–10. doi:10.1890/10-0340.1. hdl:1885/152287. ISSN  0012-9658.
  14. ^ Shao J (1998) Matematiksel istatistik. Springer. New York, New York, ABD
  15. ^ Steve Simon (2010) "Sıfır olaylı güven aralığı", The Children's Mercy Hospital, Kansas City, Mo. (web sitesi: " İstatistik konuları veya Tıbbi Araştırma Arşivlendi 15 Ekim 2011, Wayback Makinesi )
  16. ^ Reiczigel, J (2003). "Binom parametresi için güven aralıkları: bazı yeni hususlar" (PDF). Tıpta İstatistik. 22 (4): 611–621. doi:10.1002 / sim.1320. PMID  12590417.
  17. ^ Sauro J., Lewis J.R. (2005) "Wald, Adj-Wald, Exact ve Wilson aralıkları Hesaplayıcı Karşılaştırması" Arşivlendi 2012-06-18 de Wayback Makinesi. İnsan Faktörleri ve Ergonomi Derneği Bildirileri, 49. Yıllık Toplantısı (HFES 2005), Orlando, FL, s. 2100–2104
  18. ^ Ross, T. D. (2003). "Binom oranı ve Poisson oranı tahmini için doğru güven aralıkları". Biyoloji ve Tıp Alanında Bilgisayarlar. 33 (6): 509–531. doi:10.1016 / S0010-4825 (03) 00019-2. PMID  12878234.