Sınıf içi korelasyon - Intraclass correlation

Bir nokta arsa yüksek sınıf içi korelasyona sahip bir veri kümesi gösteren. Aynı gruptaki değerler benzer olma eğilimindedir.
Bir nokta arsa düşük sınıf içi korelasyona sahip bir veri kümesi gösteren. Aynı gruptaki değerlerin benzer olma eğilimi yoktur.

İçinde İstatistik, sınıf içi korelasyon, ya da sınıf içi korelasyon katsayısı (ICC),[1] bir tanımlayıcı istatistik gruplar halinde düzenlenmiş birimler üzerinde kantitatif ölçümler yapıldığında kullanılabilir. Aynı gruptaki birimlerin birbirine ne kadar güçlü benzediğini açıklar. Bir tür olarak görülürken ilişki Diğer birçok korelasyon ölçütünün aksine, eşleştirilmiş gözlemler olarak yapılandırılmış verilerden ziyade, gruplar halinde yapılandırılmış veriler üzerinde çalışır.

sınıf içi korelasyon sabit bir akrabalık derecesine sahip bireylerin (örneğin, tam kardeşler) nicel bir özellik açısından birbirlerine ne ölçüde benzediklerini ölçmek için yaygın olarak kullanılır (bkz. kalıtım ). Öne çıkan diğer bir uygulama, aynı miktarı ölçen farklı gözlemciler tarafından yapılan nicel ölçümlerin tutarlılığının veya tekrarlanabilirliğinin değerlendirilmesidir.

Erken ICC tanımı: tarafsız ama karmaşık formül

Sınıf içi korelasyonlarla ilgili en eski çalışma, eşleştirilmiş ölçümler durumuna odaklandı ve önerilecek ilk sınıf içi korelasyon (ICC) istatistikleri, sınıflar arası korelasyon (Pearson korelasyonu).

Aşağıdakilerden oluşan bir veri seti düşünün: N eşleştirilmiş veri değerleri (xn,1xn,2), için n = 1, ..., N. Sınıf içi korelasyon r başlangıçta önerilen[2] tarafından Ronald Fisher[3] dır-dir

nerede

Bu istatistiğin sonraki sürümleri [3] Kullandı özgürlük derecesi 2N 1 hesaplamak için paydada s2 ve N 1 hesaplamak için paydada r, Böylece s2 tarafsız hale gelir ve r tarafsız olursa s bilinen.

Bu ICC ile sınıflar arası (Pearson) korelasyon ortalama ve varyansı tahmin etmek için verilerin havuzda toplanmasıdır. Bunun nedeni, bir sınıf içi korelasyonun istendiği ortamda, çiftlerin sırasız olarak kabul edilmesidir. Örneğin, ikizlerin benzerliğini inceliyorsak, ikiz bir çift içindeki iki birey için değerleri sıralamanın genellikle anlamlı bir yolu yoktur. Sınıflar arası korelasyon gibi, eşleştirilmiş veriler için sınıf içi korelasyon, Aralık  [−1, +1].

Sınıf içi korelasyon, 2'den fazla değere sahip gruplara sahip veri setleri için de tanımlanır. Üç değerden oluşan gruplar için şu şekilde tanımlanır:[3]

nerede

Grup başına öğe sayısı arttıkça, bu ifadedeki ürünler arası terimlerin sayısı da artar. Aşağıdaki eşdeğer formun hesaplanması daha kolaydır:

nerede K grup başına veri değerlerinin sayısıdır ve örnek ortalamasıdır ninci grubu.[3] Bu form genellikle Harris.[4] Soldaki terim negatif değildir; sonuç olarak sınıf içi korelasyon tatmin etmelidir

Büyük için K, bu ICC neredeyse eşittir

bu, gruplar arasındaki varyasyondan kaynaklanan toplam varyansın fraksiyonu olarak yorumlanabilir. Ronald Fisher klasik kitabındaki sınıf içi korelasyona bir bölüm ayırmıştır. Araştırma Çalışanları için İstatistik Yöntemler.[3]

Tamamen gürültülü bir popülasyondan gelen veriler için, Fisher'in formülü yaklaşık 0'a dağılmış, yani bazen negatif olan ICC değerleri üretir. Bunun nedeni, Fisher'ın formülü tarafsız olarak tasarlaması ve bu nedenle tahminlerinin bazen fazla, bazen de olduğundan az tahmin edilmesidir. Popülasyondaki küçük veya 0 temel değerler için, bir örnekten hesaplanan ICC negatif olabilir.

Modern ICC tanımları: daha basit formül ancak pozitif önyargı

Ronald Fisher'dan başlayarak, sınıf içi korelasyon şu çerçevede ele alınmıştır: varyans analizi (ANOVA) ve daha yakın zamanda çerçevesinde rastgele efekt modelleri. Bir dizi ICC tahmincisi önerilmiştir. Tahmin edicilerin çoğu rastgele etkiler modeli ile tanımlanabilir

nerede Yij ... beninci içinde gözlem jinci grup μ genel olarak gözlemlenmemiş anlamına gelmek, αj gruptaki tüm değerler tarafından paylaşılan, gözlemlenmemiş rastgele bir etkidir j, ve εij gözlemlenmemiş bir gürültü terimidir.[5] Modelin tanımlanması için, αj ve εij beklenen sıfır değerine sahip olduğu ve birbiriyle ilintisiz olduğu varsayılır. Ayrıca αj aynı şekilde dağıtıldığı varsayılır ve εij aynı şekilde dağıtıldığı varsayılmaktadır. Varyansı αj gösterilir σ2
α
ve varyansı εij gösterilir σ2
ε
.

Bu çerçevede nüfus ICC'si:[6]

Bu ANOVA çerçevesinin bir avantajı, farklı grupların farklı sayıda veri değerine sahip olabilmesidir; bu, daha önceki ICC istatistiklerini kullanarak idare edilmesi zordur. Bu ICC her zaman negatif değildir ve "gruplar arası" olan toplam varyans oranı olarak yorumlanmasına izin verir. Bu ICC, ortak değişken etkilere izin verecek şekilde genelleştirilebilir, bu durumda ICC, ortak değişkene göre ayarlanmış veri değerlerinin sınıf içi benzerliğini yakaladığı şeklinde yorumlanır.[7]

Bu ifade asla negatif olamaz (Fisher'in orijinal formülünün aksine) ve bu nedenle, ICC'si 0 olan bir popülasyondan alınan numunelerde, numunelerdeki ICC'ler popülasyonun ICC'sinden daha yüksek olacaktır.

Hepsi aynı popülasyon parametresini tahmin etmeyen bir dizi farklı ICC istatistiği önerilmiştir. Belirli bir kullanım için hangi ICC istatistiklerinin uygun olduğu konusunda önemli tartışmalar olmuştur, çünkü bunlar aynı veriler için belirgin şekilde farklı sonuçlar üretebilirler.[8][9]

Pearson korelasyon katsayısı ile ilişki

Fisher'in orijinal ICC, cebirsel biçimi açısından, ICC'ye en çok benzeyen ICC'dir. Pearson korelasyon katsayısı. İki istatistik arasındaki önemli bir fark, ICC'de verilerin havuzlanmış bir ortalama ve standart sapma kullanılarak ortalanması ve ölçeklendirilmesi, Pearson korelasyonunda ise her değişkenin kendi ortalaması ve standart sapması ile ortalanması ve ölçeklendirilmesidir. ICC için bu havuzlanmış ölçeklendirme anlamlıdır çünkü tüm ölçümler aynı miktardadır (farklı gruplardaki birimlerde de olsa). Örneğin, her "çiftin", tek bir birim için iki farklı ölçüm yerine (örneğin, yüksekliği ölçmek) iki birimin her biri için yapılan tek bir ölçüm olduğu (örneğin, bir çift özdeş ikizde her bir ikizin tartılması) ve her birey için ağırlık), ICC, Pearson korelasyonundan daha doğal bir ilişki ölçüsüdür.

Pearson korelasyonunun önemli bir özelliği, ayrı ayrı uygulama için değişmez olmasıdır. doğrusal dönüşümler karşılaştırılan iki değişkene. Böylece, eğer ilişki kuruyorsak X ve Ynerede söyle Y = 2X + 1, arasındaki Pearson korelasyonu X ve Y 1 - mükemmel bir korelasyon. Bir gruptaki her bir değere hangi dönüşümün uygulanacağına karar vermenin bir temeli olmadığından, bu özellik ICC için anlamlı değildir. Bununla birlikte, tüm gruplardaki tüm veriler aynı doğrusal dönüşüme tabi tutulursa, ICC değişmez.

Gözlemciler arasında uygunluğu değerlendirmede kullanın

ICC, aynı miktarı ölçen birden fazla gözlemci tarafından yapılan ölçümlerin tutarlılığını veya uygunluğunu değerlendirmek için kullanılır.[10] Örneğin, birkaç doktordan CT taramasının sonuçlarını kanser ilerlemesi belirtileri için puanlamaları istenirse, puanların birbirine ne kadar tutarlı olduğunu sorabiliriz. Gerçek biliniyorsa (örneğin, CT taramaları daha sonra keşif ameliyatı geçiren hastalar üzerindeyse), o zaman odak genellikle doktorların puanlarının gerçeğe ne kadar iyi uyduğudur. Gerçek bilinmiyorsa, sadece skorlar arasındaki benzerliği düşünebiliriz. Bu sorunun önemli bir yönü, her ikisinin de olmasıdır. gözlemciler arası ve gözlemci içi değişkenlik. Gözlemciler arası değişkenlik, gözlemciler arasındaki sistematik farklılıkları ifade eder - örneğin, bir doktor hastaları diğer doktorlardan daha yüksek bir risk düzeyinde sürekli olarak puanlayabilir. Gözlemci içi değişkenlik, belirli bir gözlemcinin belirli bir hasta üzerindeki puanının sistematik bir farklılığın parçası olmayan sapmalarını ifade eder.

ICC, aşağıdakilere uygulanmak üzere inşa edilmiştir: değiştirilebilir ölçümler - yani, bir grup içindeki ölçümleri sıralamanın anlamlı bir yolu olmayan gruplanmış veriler. Gözlemciler arasındaki uyumu değerlendirirken, aynı gözlemciler incelenen her bir unsuru değerlendirirse, o zaman gözlemciler arasında sistematik farklılıklar olması muhtemeldir ve bu da değiştirilebilirlik kavramı ile çelişir. ICC, sistematik farklılıkların olduğu bir durumda kullanılıyorsa, sonuç, gözlemci içi ve gözlemciler arası değişkenliğin bileşik bir ölçüsüdür. Değiştirilebilirliğin makul bir şekilde kabul edilebileceği varsayılabilecek bir durum, örneğin bir kan numunesi gibi puanlanacak bir numunenin birden fazla bölüme bölünmesi ve bölümlerin aynı cihaz üzerinde ayrı ayrı ölçülmesidir. Bu durumda, değiştirilebilirlik, numuneleri çalıştırma dizisi mevcut olmadığı sürece geçerli olacaktır.

Beri sınıf içi korelasyon katsayısı Gözlemci içi ve gözlemciler arası değişkenliğin bir bileşimini verir, gözlemcilerin değiş tokuşu mümkün olmadığında sonuçlarının yorumlanması bazen zor kabul edilir. Cohen'inki gibi alternatif önlemler kappa istatistiği, Fleiss kappa, ve uyum korelasyon katsayısı[11] değiş tokuş edilemeyen gözlemciler arasında daha uygun anlaşma önlemleri olarak önerilmiştir.

Yazılım paketlerinde hesaplama

Gözlemciler arası uyumun üç senaryosuna uygulanan farklı sınıf içi korelasyon katsayısı tanımları.

ICC, açık kaynak yazılım paketinde desteklenmektedir R (paketlerle "icc" işlevini kullanarak psy veya irr veya paketteki "ICC" işlevi aracılığıyla psikoloji.) rptR paket [12] Karma model çerçevesinde Gauss, binom ve Poisson dağıtılmış veriler için ICC ve tekrarlanabilirlik tahmini için yöntemler sağlar. Paket özellikle, ayarlanmış ICC'yi tahmin etmeye (yani diğer değişkenleri kontrol etmeye) izin verir ve parametrik önyüklemeye ve kalıntıların permütasyonuna dayalı anlamlara dayalı güven aralıklarını hesaplar. Ticari yazılım, örneğin ICC'yi de destekler Stata veya SPSS [13]

Farklı ICC türleri [3] Arşivlendi 2009-03-03 de Wayback Makinesi
Shrout ve Fleiss sözleşmesiMcGraw ve Wong sözleşmesi [14]SPSS ve Stata'daki isim [15][16]
ICC (1,1)Tek yönlü rastgele, tek puanlı ICC (1)Tek yönlü rastgele, tek ölçümler
ICC (2; 1)İki yönlü rastgele, tek puanlı ICC (A, 1)İki yönlü rastgele, tek ölçümler, mutlak anlaşma
ICC (3; 1)İki yönlü karışık, tek puanlı ICC (C, 1)İki yönlü karışık, tek ölçüler, tutarlılık
Tanımsızİki yönlü rastgele, tek puanlı ICC (C, 1)İki yönlü rastgele, tek ölçümler, tutarlılık
Tanımsızİki yönlü karışık, tek puanlı ICC (A, 1)İki yönlü karışık, tek ölçüler, mutlak anlaşma
ICC (1; k)Tek yönlü rastgele, ortalama puan ICC (k)Tek yönlü rastgele, ortalama önlemler
ICC (2; k)İki yönlü rastgele, ortalama puan ICC (A, k)İki yönlü rastgele, ortalama ölçümler, mutlak anlaşma
ICC (3; k)İki yönlü karışık, ortalama puan ICC (C, k)İki yönlü karışık, ortalama ölçüler, tutarlılık
Tanımsızİki yönlü rastgele, ortalama puan ICC (C, k)İki yönlü rastgele, ortalama ölçüler, tutarlılık
Tanımsızİki yönlü karışık, ortalama puan ICC (A, k)İki yönlü karışık, ortalama ölçüler, mutlak anlaşma

Üç model şunlardır:

  • Tek yönlü rastgele etkiler: her denek, rastgele seçilmiş farklı bir k kümesi tarafından ölçülür;
  • İki yönlü rastgele: k değerlendirici rastgele seçilir, ardından her denek aynı k değerlendirici grubu tarafından ölçülür;
  • İki yönlü karışık: k sabit puanlayıcı tanımlanır. Her konu k değerlendiriciler tarafından ölçülür.

Ölçüm sayısı:

  • Tek ölçüler: Deneyde birden fazla ölçü alınmasına rağmen, güvenilirlik, tek bir değerlendiricinin tek bir ölçüsünün gerçekleştirileceği bir bağlama uygulanır;
  • Ortalama ölçüler: Güvenilirlik, her konu için k değerlendiricinin ölçütlerinin ortalamasının alınacağı bir bağlama uygulanır.

Tutarlılık veya mutlak anlaşma:

  • Mutlak anlaşma: hem değerlendiricilerin sistematik hataları hem de rastgele artık hatalar dahil olmak üzere iki değerlendirici arasındaki anlaşma ilgi çekicidir;
  • Tutarlılık: Aynı değerlendirici tarafından tekrarlanan ölçümler bağlamında, değerlendiricinin sistematik hataları iptal edilir ve sadece rastgele kalan hata tutulur.

Tutarlılık ICC, tek yönlü rastgele etkiler modelinde tahmin edilemez, çünkü değerlendiriciler arası ve artık varyansları ayırmanın bir yolu yoktur.

Yorumlama

Cicchetti (1994)[17] aşağıdaki sıkça alıntılanan kuralları verir kappa veya ICC değerlendiriciler arası anlaşma önlemleri:

  • 0,40'tan az - zayıf.
  • 0,40 ile 0,59 arası - orta.
  • 0,60 ile 0,74 arasında - iyi.
  • 0,75 ile 1,00 arasında - mükemmel.

Koo ve Li (2016) tarafından farklı bir kılavuz verilmiştir:[18]

  • 0,50'nin altında: zayıf
  • 0,50 ile 0,75 arasında: orta
  • 0,75 ile 0,90 arasında: iyi
  • 0,90'ın üzerinde: mükemmel

Ayrıca bakınız

Referanslar

  1. ^ Koch, Gary G. (1982). "Sınıf içi korelasyon katsayısı". Samuel Kotz ve Norman L. Johnson (ed.). İstatistik Bilimleri Ansiklopedisi. 4. New York: John Wiley & Sons. s. 213–217.
  2. ^ Bartko JJ (Ağustos 1966). "Güvenilirliğin bir ölçüsü olarak sınıf içi korelasyon katsayısı". Psikolojik Raporlar. 19 (1): 3–11. doi:10.2466 / pr0.1966.19.1.3. PMID  5942109.
  3. ^ a b c d e Ronald A. Fisher (1954). Araştırma Çalışanları için İstatistik Yöntemler (On ikinci ed.). Edinburg: Oliver ve Boyd. ISBN  978-0-05-002170-5.
  4. ^ J. Arthur Harris (Ekim 1913). "Olası Kombinasyon Sayısı Büyük Olduğunda Sınıf İçi ve Sınıflar Arası Korelasyon Katsayılarının Sınıf Momentlerinden Hesaplanması Hakkında". Biometrika. 9 (3/4): 446–472. doi:10.1093 / biomet / 9.3-4.446. JSTOR  2331901.
  5. ^ Donner A, Koval JJ (Mart 1980). "Aile verilerinin analizinde sınıf içi korelasyon tahmini". Biyometri. 36 (1): 19–25. doi:10.2307/2530491. JSTOR  2530491. PMID  7370372.
  6. ^ Anova modelinde ICC'nin iki öğenin korelasyonu olduğunun kanıtı: ocram[1], Sınıf içi korelasyon katsayısını anlama, URL (sürüm: 2012-12-05): [2]
  7. ^ Stanish, William; Taylor Noel (1983). "Kovaryans Modeli Analizi İçin Sınıf İçi Korelasyon Katsayısının Tahmini". Amerikan İstatistikçi. 37 (3): 221–224. doi:10.2307/2683375. JSTOR  2683375.
  8. ^ Müller R, Büttner P (Aralık 1994). "Sınıf içi korelasyon katsayılarının kritik bir tartışması". Tıpta İstatistik. 13 (23–24): 2465–76. doi:10.1002 / sim.4780132310. PMID  7701147. Yoruma da bakın:
  9. ^ Kenneth O. McGraw ve S. P. Wong (1996). "Bazı sınıf içi korelasyon katsayıları hakkında çıkarımlar oluşturma". Psikolojik Yöntemler. 1: 30–46. doi:10.1037 / 1082-989X.1.1.30. Makalede birkaç hata var:
  10. ^ Shrout PE, Fleiss JL (Mart 1979). "Sınıf içi korelasyonlar: değerlendirici güvenilirliğini değerlendirmede kullanır". Psikolojik Bülten. 86 (2): 420–8. doi:10.1037/0033-2909.86.2.420. PMID  18839484.
  11. ^ Carol A. E. Nickerson (Aralık 1997). "Yeniden Üretilebilirliği Değerlendirmek İçin Bir Uyum Korelasyon Katsayısı 'Üzerine Bir Not'". Biyometri. 53 (4): 1503–1507. doi:10.2307/2533516. JSTOR  2533516.
  12. ^ Stoffel MA, Nakagawa S, Schielzeth H (2017). "rptR: genelleştirilmiş doğrusal karma etki modelleri ile tekrarlanabilirlik tahmini ve varyans ayrıştırması". Ekoloji ve Evrimde Yöntemler. 8 (11): 1639–1644. doi:10.1111 / 2041-210x.12797. ISSN  2041-210X.
  13. ^ Richard N. MacLennan (Kasım 1993). "Windows 5.0 için SPSS ile Değerlendiriciler Arası Güvenilirlik". Amerikan İstatistikçi. 47 (4): 292–296. doi:10.2307/2685289. JSTOR  2685289.
  14. ^ Kenneth O. McGraw; S. P. Wong (1996). "Bazı Sınıf İçi Korelasyon Katsayıları Hakkında Çıkarımlar Oluşturma". Psikolojik Yöntemler. 1 (1): 30–40. doi:10.1037 / 1082-989X.1.1.30.
  15. ^ Stata kullanıcı kılavuzu sürümü 15 (PDF). College Station, Teksas: Stata Press. 2017. sayfa 1101–1123. ISBN  978-1-59718-249-2.
  16. ^ David C. Howell. "Sınıf içi korelasyon katsayıları" (PDF).
  17. ^ Cicchetti, Domenic V. (1994). "Psikolojide normlanmış ve standartlaştırılmış değerlendirme araçlarını değerlendirmek için kılavuzlar, kriterler ve pratik kurallar". Psikolojik değerlendirme. 6 (4): 284–290. doi:10.1037/1040-3590.6.4.284.
  18. ^ Koo TK, Li MY (Haziran 2016). "Güvenilirlik Araştırmaları için Sınıf İçi Korelasyon Katsayılarının Seçilmesi ve Raporlanması Hakkında Bir Kılavuz". Kayropraktik Tıp Dergisi. 15 (2): 155–63. doi:10.1016 / j.jcm.2016.02.012. PMC  4913118. PMID  27330520.

Dış bağlantılar