Tek yönlü varyans analizi - One-way analysis of variance

İçinde İstatistik, tek yön varyans analizi (kısaltılmış tek yönlü ANOVA) iki veya daha fazla numunenin ortalamasını karşılaştırmak için kullanılabilen bir tekniktir ( F dağılımı ). Bu teknik yalnızca sayısal yanıt verileri için, "Y", genellikle bir değişken ve sayısal veya (genellikle) kategorik girdi verileri, "X", her zaman bir değişken, dolayısıyla "tek yönlü" için kullanılabilir.[1]

ANOVA, sıfır hipotezi, tüm gruplardaki örneklerin aynı ortalama değerlere sahip popülasyonlardan alındığını belirtir. Bunu yapmak için, popülasyon varyansına ilişkin iki tahmin yapılır. Bu tahminler çeşitli varsayımlara dayanmaktadır (aşağıya bakınız ). ANOVA, ortalamalar arasında hesaplanan varyansın örneklerdeki varyansa oranı olan bir F-istatistiği üretir. Grup ortalamaları aynı ortalama değerlere sahip popülasyonlardan alınmışsa, grup ortalamaları arasındaki varyans, örneklerin varyansından daha düşük olmalıdır. Merkezi Limit Teoremi. Bu nedenle daha yüksek bir oran, örneklerin farklı ortalama değerlere sahip popülasyonlardan alındığı anlamına gelir.[1]

Bununla birlikte, tipik olarak, tek yönlü ANOVA, en az üç grup arasındaki farklılıkları test etmek için kullanılır, çünkü iki gruplu durum bir t testi (Gosset, 1908). Karşılaştırılacak yalnızca iki yol olduğunda, t testi ve F testi eşdeğerdir; ANOVA ve arasındaki ilişki t tarafından verilir F = t2. Tek yönlü ANOVA'nın bir uzantısı iki yönlü varyans analizi iki farklı kategorik bağımsız değişkenin tek bir bağımlı değişken üzerindeki etkisini inceleyen.

Varsayımlar

Tek yönlü bir ANOVA'nın sonuçları, aşağıdaki varsayımlar karşılandığı sürece güvenilir kabul edilebilir:

Veriler ise sıra, bu teste parametrik olmayan bir alternatif, aşağıdaki gibi kullanılmalıdır: Kruskal – Wallis tek yönlü varyans analizi. Varyansların eşit olduğu bilinmiyorsa, 2-örneklemli bir genelleme Welch'in t testi kullanılabilir.[2]

Nüfusun normalliğinden ayrılışlar

ANOVA, normallik varsayımının ihlalleri açısından nispeten sağlam bir prosedürdür.[3]

Tek yönlü ANOVA, faktöriyel ve çok değişkenli düzenlerin yanı sıra kovaryans analizine genelleştirilebilir.[açıklama gerekli ]

Popüler literatürde, bunların hiçbirinin F-testler güçlü her bir popülasyonun aşağıdakileri takip ettiği varsayımının ciddi ihlalleri olduğunda normal dağılım, özellikle küçük alfa seviyeleri ve dengesiz düzenler için.[4] Ayrıca, altta yatan varsayımın Eş varyans ihlal edildiğinde Tip I hatası özellikler çok daha şiddetli dejenere olur.[5]

Ancak bu, 1950'lerde ve öncesinde yapılan çalışmalara dayanan bir yanılgıdır. Konunun Monte Carlo simülasyonu ile ilk kapsamlı araştırması Donaldson (1966) idi.[6] Olağan sapmalar (pozitif çarpıklık, eşit olmayan varyanslar) altında " F-test ihtiyatlıdır "ve bu nedenle bir değişkenin anlamlı olduğunu bulmak olması gerekenden daha az olasıdır. Bununla birlikte, örnek boyutu veya hücre sayısı arttıkça," güç eğrileri, normal dağılım ". Tiku (1971)," normal olmayan teori gücünün F normal teori gücünden, artan örneklem boyutuyla keskin bir şekilde azalan bir düzeltme terimi ile farklı olduğu bulunmuştur. "[7] Normal olmama sorunu, özellikle büyük örneklerde, popüler makalelerin öne sürdüğünden çok daha az ciddidir.

Mevcut görüş, "Monte-Carlo çalışmaları, analiz edilen değişkenlerin popülasyondaki normal dağılım varsayımının ihlallerine ne kadar duyarlı olduklarını belirlemek için normal dağılıma dayalı testlerle yoğun bir şekilde kullanılmıştır. Bu çalışmalardan elde edilen genel sonuç şudur: Bu tür ihlallerin sonuçları önceden düşünüldüğünden daha az şiddetlidir. Bu sonuçlar, hiç kimseyi normallik varsayımı konusunda endişelenmekten tamamen caydırmasa da, tüm araştırma alanlarında dağılıma bağlı istatistiksel testlerin genel popülaritesini artırmıştır. "[8]

Faktöriyel mizanpajdaki parametrik olmayan alternatifler için bkz.Sawilowsky.[9] Daha fazla tartışma için bkz. Saflarda ANOVA.

Sabit etkiler durumu, tamamen rastgele deney, dengesiz veriler

Model

Normal doğrusal model, farklı araçlarla aynı şekilde çan şeklinde (normal) eğriler olan olasılık dağılımlarına sahip tedavi gruplarını tanımlar. Bu nedenle modellerin uydurulması sadece her tedavi grubunun araçlarını ve bir varyans hesaplamasını gerektirir (tedavi grupları içinde ortalama bir varyans kullanılır). Ortalamaların ve varyansın hesaplamaları, hipotez testinin bir parçası olarak gerçekleştirilir.

Tamamen rastgele bir deney için yaygın olarak kullanılan normal doğrusal modeller şunlardır:[10]

(araçlar modeli)

veya

(efekt modeli)

nerede

deneysel birimlerin üzerinde bir dizindir
tedavi grupları üzerinden bir indekstir
j. tedavi grubundaki deneysel birimlerin sayısıdır
toplam deneysel birim sayısı
gözlemlerdir
j. tedavi grubu için gözlemlerin ortalamasıdır
gözlemlerin genel ortalamasıdır
j. tedavi etkisidir, genel ortalamadan sapma
, normal olarak dağıtılmış sıfır ortalama rastgele hatalardır.

İçerik deneysel birimler üzerinden çeşitli şekillerde yorumlanabilir. Bazı deneylerde, aynı deneysel birim bir dizi tedaviye tabidir; belirli bir birime işaret edebilir. Diğerlerinde, her tedavi grubunun farklı deneysel birimleri vardır; basitçe bir indeks olabilir -nci liste.

Verilerin verileri ve istatistiksel özetleri

Deneysel gözlemleri organize etmenin bir yolu sütunlardaki gruplarla:

ANOVA veri organizasyonu, Dengesiz, Tek faktör
Grup Gözlem Listeleri
1
2
3
Grup Özet İstatistikleriGenel Özet İstatistikleri
# Gözlemlendi# Gözlemlendi
ToplamToplam
Toplam SqToplam Sq
Anlamına gelmekAnlamına gelmek
VaryansVaryans

Modeli özetlerle karşılaştırmak: ve . Genel ortalama ve genel varyans, grup ortalamalarından ve varyanslarından değil, genel toplamlardan hesaplanır.

Hipotez testi

Özet istatistikler göz önüne alındığında, hipotez testinin hesaplamaları tablo halinde gösterilir. Açıklayıcı değerleri için iki SS sütunu gösterilirken, sonuçları görüntülemek için yalnızca bir sütun gereklidir.

Sabit model, tek faktör, tamamen randomize deney için ANOVA tablosu
Varyasyon kaynağıKarelerin toplamıKarelerin toplamıÖzgürlük derecesiOrtalama kareF
Açıklayıcı SS[11]Hesaplamalı SS[12]DFHANIM
Tedaviler
Hata
Toplam

karşılık gelen varyans tahmini modelin.

Analiz özeti

Temel ANOVA analizi bir dizi hesaplamadan oluşur. Veriler tablo şeklinde toplanır. Sonra

  • Her tedavi grubu, deneysel birimlerin sayısı, iki toplam, bir ortalama ve bir varyans ile özetlenir. Tedavi grubu özetleri, ünite sayısı ve toplamları için toplamlar sağlamak üzere birleştirilir. Genel ortalama ve genel varyans, genel toplamlardan hesaplanır. Modelde tedavi ve genel araçlar kullanılmıştır.
  • Üç DF ve SS, özetlerden hesaplanır. Daha sonra MS'ler hesaplanır ve bir oran F'yi belirler.
  • Bir bilgisayar tipik olarak, işlemlerin önemli ölçüde farklı sonuçlar üretip üretmediğini belirleyen F'den bir p değeri belirler. Sonuç önemliyse, model geçici olarak geçerliliğe sahiptir.

Deney dengeli ise, tüm terimler eşittir, böylece SS denklemleri basitleştirir.

Deneysel birimlerin (veya çevresel etkilerin) homojen olmadığı daha karmaşık bir deneyde, analizde satır istatistikleri de kullanılır. Model şunlara bağlı terimler içerir: . Ekstra şartların belirlenmesi, mevcut serbestlik derecesi sayısını azaltır.

Misal

Bir faktörün üç farklı seviyesinin bir yanıt üzerindeki etkisini incelemek için bir deney düşünün (örneğin, bitki büyümesi üzerinde bir gübrenin üç seviyesi). Her seviye için 6 gözlemimiz olsaydı, deneyin sonucunu böyle bir tabloya yazabilirdik. a1, a2, ve a3 incelenen faktörün üç seviyesidir.

a1a2a3
6813
8129
4911
5118
367
4812

H olarak gösterilen boş hipotez0genel olarak F- Bu deney için test, faktörün üç seviyesinin de ortalama olarak aynı yanıtı vermesi olacaktır. Hesaplamak için F- oran:

Aşama 1: Her gruptaki ortalamayı hesaplayın:

Adım 2: Genel ortalamayı hesaplayın:

nerede a grupların sayısıdır.

Aşama 3: "Gruplar arası" farkların kareleri toplamını hesaplayın:

nerede n grup başına veri değerlerinin sayısıdır.

Gruplar arası serbestlik derecesi, grup sayısından bir azdır

bu nedenle gruplar arası ortalama kare değeri

4. Adım: "Grup içi" karelerin toplamını hesaplayın. Her gruptaki verileri ortalayarak başlayın

a1a2a3
6−5=18−9=−113−10=3
8−5=312−9=39−10=−1
4−5=−19−9=011−10=1
5−5=011−9=28−10=−2
3−5=−26−9=−37−10=−3
4−5=−18−9=−112−10=2

Grup içi kareler toplamı, bu tablodaki 18 değerin tümünün karelerinin toplamıdır

Grup içi serbestlik derecesi

F-dens-2-15df.svg

Böylece grup içi ortalama kare değeri

Adım 5: F-ratio

Kritik değer, testi reddetmek için test istatistiğinin aşması gereken sayıdır. Bu durumda, Feleştiri(2,15) = 3,68 içinde α = 0.05. Dan beri F= 9.3> 3.68, sonuçlar önemli % 5 anlamlılık düzeyinde. Üç gruptaki beklenen değerlerin farklı olduğuna dair güçlü kanıtlar olduğu sonucuna vararak sıfır hipotezi reddedilebilir. p değeri bu test için 0.002'dir.

Gerçekleştirdikten sonra F-test, grup araçlarının bazı "post-hoc" analizlerinin yapılması yaygındır. Bu durumda, ilk iki grup araçları 4 birim farklılık gösterir, birinci ve üçüncü grup araçları 5 birim farklılık gösterir ve ikinci ve üçüncü grup araçları sadece 1 birim farklılık gösterir. standart hata bu farklılıkların her biri . Bu nedenle, birinci grup diğer gruplardan oldukça farklıdır, çünkü ortalama fark standart hatanın daha fazla katıdır, bu nedenle son derece emin olabiliriz nüfus anlamı Birinci grubun% 50'si diğer grupların nüfus ortalamasından farklıdır. Bununla birlikte, ikinci ve üçüncü grupların birbirinden farklı popülasyon ortalamalarına sahip olduğuna dair bir kanıt yoktur, çünkü bir birimlik ortalama farkı standart hatayla karşılaştırılabilir.

Not F(xy) bir F-dağıtım kümülatif dağılım işlevi x paydaki serbestlik derecesi ve y paydadaki serbestlik derecesi.

Ayrıca bakınız

Notlar

  1. ^ a b Howell, David (2002). Psikoloji için İstatistiksel Yöntemler. Duxbury. pp.324–325. ISBN  0-534-37770-X.
  2. ^ Welch, B.L. (1951). "Birkaç Ortalama Değerin Karşılaştırılması Üzerine: Alternatif Bir Yaklaşım". Biometrika. 38 (3/4): 330–336. doi:10.2307/2332579. JSTOR  2332579.
  3. ^ Kirk, RE (1995). Deneysel Tasarım: Davranış Bilimleri İçin Prosedürler (3 ed.). Pacific Grove, CA, ABD: Brooks / Cole.
  4. ^ Blair, R.C. (1981). Varyans ve kovaryansın sabit etkiler analizinin altında yatan varsayımları karşılamamanın sonuçlarına bir tepki.'". Eğitim Araştırmalarının Gözden Geçirilmesi. 51 (4): 499–507. doi:10.3102/00346543051004499.
  5. ^ Randolf, E. A .; Barcikowski, R. S. (1989). "Bir Monte Carlo çalışmasında popülasyon parametreleri olarak gerçek çalışma değerleri kullanıldığında Tip I hata oranı". Chicago Mid-Western Educational Research Association 11. Yıllık Toplantısında Sunulan Bildiri.
  6. ^ Donaldson, Theodore S. (1966). "Normal Olmayan Dağılımlar ve Eşitsiz Hata Varyansları için F Testinin Gücü". Amerika Birleşik Devletleri Hava Kuvvetleri Projesi RAND için Hazırlanan Kağıt.
  7. ^ Tiku, M.L. (1971). "Güç Fonksiyonu F-Normal Olmayan Durumlarda Test ". Amerikan İstatistik Derneği Dergisi. 66 (336): 913–916. doi:10.1080/01621459.1971.10482371.
  8. ^ "Arşivlenmiş kopya". Arşivlenen orijinal 2018-12-04 tarihinde. Alındı 2016-09-22.CS1 Maint: başlık olarak arşivlenmiş kopya (bağlantı)
  9. ^ Sawilowsky, S. (1990). "Deneysel tasarımda parametrik olmayan etkileşim testleri". Eğitim Araştırmalarının Gözden Geçirilmesi. 60 (1): 91–126. doi:10.3102/00346543060001091.
  10. ^ Montgomery, Douglas C. (2001). Deneylerin Tasarımı ve Analizi (5. baskı). New York: Wiley. s. Bölüm 3–2. ISBN  9780471316497.
  11. ^ Moore, David S .; McCabe, George P. (2003). İstatistik Uygulamasına Giriş (4. baskı). W H Freeman & Co. s. 764. ISBN  0716796570.
  12. ^ Winkler, Robert L .; Hays, William L. (1975). İstatistikler: Olasılık, Çıkarım ve Karar (2. baskı). New York: Holt, Rinehart ve Winston. s.761.

daha fazla okuma