Kovaryans - Covariance

İki rastgele değişkenin kovaryansının işareti X ve Y

İçinde olasılık teorisi ve İstatistik, kovaryans iki ortak değişkenliğin bir ölçüsüdür rastgele değişkenler.[1] Bir değişkenin daha büyük değerleri esas olarak diğer değişkenin daha büyük değerlerine karşılık gelirse ve aynı şey daha düşük değerler için de geçerliyse (yani, değişkenler benzer davranış gösterme eğilimindedir), kovaryans pozitiftir.[2] Tersi durumda, bir değişkenin daha büyük değerleri esas olarak diğerinin daha küçük değerlerine karşılık geldiğinde (yani, değişkenler zıt davranış gösterme eğilimindedir), kovaryans negatiftir. Kovaryansın işareti bu nedenle, Doğrusal ilişki değişkenler arasında. Kovaryansın büyüklüğünü yorumlamak kolay değildir çünkü normalize edilmemiştir ve dolayısıyla değişkenlerin büyüklüğüne bağlıdır. kovaryansın normalleştirilmiş versiyonu, korelasyon katsayısı ancak, büyüklüğü ile doğrusal ilişkinin gücünü gösterir.

(1) iki rastgele değişkenin kovaryansı arasında bir ayrım yapılmalıdır; nüfus parametre bu, mülkiyeti olarak görülebilir ortak olasılık dağılımı ve (2) örneklem kovaryans, numunenin bir tanımlayıcısı olarak hizmet etmenin yanı sıra, aynı zamanda bir tahmini nüfus parametresinin değeri.

Tanım

İki kişilik ortaklaşa dağıtılan gerçek değerli rastgele değişkenler ve sonlu ikinci anlar kovaryans, bireysel beklenen değerlerinden sapmalarının ürününün beklenen değeri (veya ortalaması) olarak tanımlanır:[3][4]:s. 119

 

 

 

 

(Denklem.1)

nerede ... beklenen değer nın-nin anlamı olarak da bilinir . Kovaryans da bazen belirtilir veya benzer şekilde varyans. Beklentilerin doğrusallık özelliğini kullanarak, bu, ürünlerinin beklenen değeri eksi beklenen değerlerinin çarpımı olarak basitleştirilebilir:

ama bu denklem duyarlıdır yıkıcı iptal (ile ilgili bölüme bakın sayısal hesaplama altında).

ölçü birimleri kovaryansın bunlar mı kez o . Aksine, korelasyon katsayıları kovaryansa bağlı olan bir boyutsuz doğrusal bağımlılığın ölçüsü. (Aslında, korelasyon katsayıları basitçe kovaryansın normalleştirilmiş bir versiyonu olarak anlaşılabilir.)

Karmaşık rasgele değişkenlerin tanımı

İki karmaşık rastgele değişken arasındaki kovaryans olarak tanımlanır[4]:s. 119

Tanımdaki ikinci faktörün karmaşık konjugasyonuna dikkat edin.

Kesikli rastgele değişkenler

Rastgele değişken çifti değerleri alabilir için eşit olasılıklarla , o zaman kovaryans, araçlar açısından eşit olarak yazılabilir ve gibi

Ayrıca araçlara doğrudan atıfta bulunulmadan eşit olarak ifade edilebilir.[5]

Daha genel olarak, eğer varsa olası gerçekleşmeleri , yani ama muhtemelen eşit olmayan olasılıklar ile için , o zaman kovaryans

Misal

Kovaryans örneğinin geometrik yorumu. Her küboid, noktasının sınırlayıcı kutusudur (x, y, f (x, y)) ve X ve Y anlamı (macenta nokta). Kovaryans, kırmızı küboidlerin hacimleri eksi mavi küplerin toplamıdır.

Farz et ki ve aşağıdakilere sahip olmak ortak olasılık kütle işlevi,[6] altı merkezi hücrenin ayrı eklem olasılıklarını verdiği altı varsayımsal gerçekleştirmenin :

x
567
y800.40.10.5
90.300.20.5
0.30.40.31

üç değer alabilir (5, 6 ve 7) iki (8 ve 9) alabilir. Araçları ve . Sonra,

Özellikleri

Kendisiyle kovaryans

varyans iki değişkenin aynı olduğu (yani, bir değişkenin her zaman diğeriyle aynı değeri aldığı) kovaryansın özel bir durumudur:[4]:s. 121

Doğrusal kombinasyonların kovaryansı

Eğer , , , ve gerçek değerli rastgele değişkenlerdir ve gerçek değerli sabitlerdir, bu durumda aşağıdaki gerçekler kovaryans tanımının bir sonucudur:

Bir dizi için gerçek değerli rastgele değişkenler ve sabitler , sahibiz

Hoeffding'in kovaryans kimliği

İki rastgele değişken arasındaki kovaryansı hesaplamak için kullanışlı bir kimlik Hoeffding'in kovaryans kimliğidir:[7]

nerede rastgele vektörün ortak kümülatif dağılım fonksiyonudur ve bunlar marjinaller.

İlişkisizlik ve bağımsızlık

Kovaryansı sıfır olan rastgele değişkenler denir ilişkisiz.[4]:s. 121 Benzer şekilde, ana köşegen dışındaki her girişte kovaryans matrisi sıfır olan rastgele vektörlerin bileşenleri de ilişkisiz olarak adlandırılır.

Eğer ve vardır bağımsız rastgele değişkenler, o zaman kovaryansları sıfırdır.[4]:s. 123[8] Bu, çünkü bağımsızlık altında

Bununla birlikte, tersi genellikle doğru değildir. Örneğin, izin ver eşit olarak dağıtılmak ve izin ver . Açıkça, ve bağımsız değiller ama

Bu durumda, arasındaki ilişki ve doğrusal değildir, korelasyon ve kovaryans ise iki rastgele değişken arasındaki doğrusal bağımlılığın ölçüleridir. Bu örnek, eğer iki rastgele değişkenin ilintisiz olması durumunda, bunların genel olarak bağımsız oldukları anlamına gelmediğini göstermektedir. Ancak, iki değişken müşterek olarak normal dağıtılan (ama sadece bireysel olarak normal dağıtılmış ), ilişkisizlik yapar bağımsızlık anlamına gelir.

İç ürünlerle ilişki

Kovaryansın özelliklerinin çoğu, bir kovaryansınkine benzer özellikleri karşıladığı gözlemlenerek zarif bir şekilde çıkarılabilir. iç ürün:

  1. iki doğrusal: sabitler için ve ve rastgele değişkenler ,
  2. simetrik:
  3. pozitif yarı kesin: tüm rastgele değişkenler için , ve ima ediyor ki sabit neredeyse kesin.

Aslında bu özellikler, kovaryansın bir iç çarpımı tanımladığını ima eder. bölüm vektör uzayı rasgele değişkenlerin alt uzayını sonlu ikinci momentle alarak ve bir sabitle farklı olan herhangi ikisini tanımlayarak elde edilir. (Bu tanımlama, yukarıdaki pozitif yarı kesinliği pozitif kesinliğe dönüştürür.) Bu bölüm vektör uzayı, sonlu ikinci moment ve ortalama sıfır olan rastgele değişkenlerin alt uzayına izomorfiktir; bu alt uzayda kovaryans tam olarak L2 örnek uzayda gerçek değerli fonksiyonların iç çarpımı.

Sonuç olarak, sonlu varyanslı rastgele değişkenler için eşitsizlik

aracılığıyla tutar Cauchy-Schwarz eşitsizliği.

Kanıt: Eğer , o zaman önemsiz bir şekilde tutar. Aksi takdirde, rastgele değişkenin

O zaman bizde

Örnek kovaryansın hesaplanması

Örnek kovaryanslar arasında dayalı değişkenler Gözlemlenmemiş bir popülasyondan alınan her birinin gözlemleri, matris girişlerle

değişkenler arasındaki kovaryansın bir tahminidir ve değişken .

Örnek ortalama ve örnek kovaryans matrisi tarafsız tahminler of anlamına gelmek ve kovaryans matrisi of rastgele vektör , bir vektör olan jinci öğe rastgele değişkenlerden biridir. Örnek kovaryans matrisinin neden paydada esasen nüfusun anlamı bilinmemektedir ve örnek ortalama ile değiştirilir . Nüfus demekse Bilindiği gibi benzer tarafsız tahmin şu şekilde verilir:

.

Genellemeler

Gerçek rastgele vektörlerin otomatik kovaryans matrisi

Bir vektör için nın-nin sonlu ikinci momentlerle birlikte dağıtılmış rasgele değişkenler, otomatik kovaryans matrisi (aynı zamanda varyans-kovaryans matrisi veya sadece kovaryans matrisi) (ayrıca belirtilir ) olarak tanımlanır[9]:s. 335

İzin Vermek olmak rastgele vektör kovaryans matrisi ile Σve izin ver Bir etki edebilecek bir matris olmak soldaki. Matris vektör ürününün kovaryans matrisi Bir X dır-dir:

Bu, doğrusallığın doğrudan bir sonucudur beklenti ve uygularken kullanışlıdır doğrusal dönüşüm, gibi beyazlatma dönüşümü, bir vektöre.

Gerçek rastgele vektörlerin çapraz kovaryans matrisi

Gerçek için rastgele vektörler ve , çapraz kovaryans matrisi eşittir[9]:s. 336

 

 

 

 

(Denklem.2)

nerede ... değiştirmek vektörün (veya matrisin) .

Bu matrisin -nci elemanı kovaryansa eşittir arasında ben-th skaler bileşeni ve j-th skaler bileşeni . Özellikle, ... değiştirmek nın-nin .

Sayısal hesaplama

Ne zaman denklem eğilimli yıkıcı iptal ile hesaplandığında kayan nokta aritmetik ve dolayısıyla bilgisayar programlarında veriler daha önce ortalanmamışsa kaçınılmalıdır.[10] Sayısal olarak kararlı algoritmalar bu durumda tercih edilmelidir.[11]

Yorumlar

Kovaryans bazen iki rastgele değişken arasındaki "doğrusal bağımlılığın" bir ölçüsü olarak adlandırılır. Bu, bağlamındaki ile aynı anlama gelmez lineer Cebir (görmek doğrusal bağımlılık ). Kovaryans normalize edildiğinde, kişi Pearson korelasyon katsayısı değişkenler arasındaki ilişkiyi açıklayan mümkün olan en iyi doğrusal fonksiyon için uygunluğun iyiliğini verir. Bu anlamda kovaryans, doğrusal bir bağımlılık ölçüsüdür.

Başvurular

Genetik ve moleküler biyolojide

Kovaryans önemli bir ölçüdür Biyoloji. Belirli dizileri DNA türler arasında diğerlerinden daha fazla korunur ve bu nedenle ikincil ve üçüncül yapıları incelemek proteinler veya RNA yapılar, diziler yakından ilişkili türlerde karşılaştırılır. Sekans değişiklikleri bulunursa veya hiçbir değişiklik bulunmazsa kodlamayan RNA (gibi mikroRNA ), RNA döngüsü gibi yaygın yapısal motifler için dizilerin gerekli olduğu bulunmuştur. Genetikte kovaryans, Genetik İlişki Matrisinin (GRM) (aka akrabalık matrisi) hesaplanması için bir temel görevi görerek, bilinen yakın akrabaları olmayan örneklemden popülasyon yapısı hakkında çıkarımda bulunmanın yanı sıra karmaşık özelliklerin kalıtsallığının tahminine ilişkin çıkarım sağlar.

Teorisinde evrim ve Doğal seçilim, Fiyat denklemi nasıl olduğunu açıklar genetik özellik zaman içinde frekanstaki değişiklikler. Denklem bir kovaryans bir özellik arasında ve Fitness, evrim ve doğal seleksiyonun matematiksel bir tanımını vermek. Gen aktarımı ve doğal seçilimin, bir popülasyonun her yeni neslindeki genlerin oranı üzerindeki etkilerini anlamanın bir yolunu sağlar.[12][13] Fiyat denklemi şu şekilde türetildi: George R. Fiyat yeniden türetmek W.D. Hamilton üzerinde çalışmak akrabalık seçimi. Fiyat denklemi örnekleri çeşitli evrimsel durumlar için inşa edilmiştir.

Finans ekonomisinde

Kovaryanslar anahtar rol oynar finansal ekonomi özellikle modern portföy teorisi Ve içinde sermaye varlıkları fiyatlandırma modeli. Çeşitli varlıkların getirileri arasındaki kovaryanslar, belirli varsayımlar altında, yatırımcıların yapması gereken farklı varlıkların göreceli tutarlarını belirlemek için kullanılır (bir normatif analiz ) veya tahmin ediliyor (içinde pozitif analiz ) bir bağlamda tutmayı seçin çeşitlendirme.

Meteorolojik ve oşinografik veri asimilasyonunda

Kovaryans matrisi, hava tahmin modellerini çalıştırmak için gereken başlangıç ​​koşullarının tahmin edilmesinde önemlidir, bu prosedür veri asimilasyonu. 'Tahmin hatası kovaryans matrisi' tipik olarak bir ortalama durum (klimatolojik ya da topluluk ortalaması) etrafındaki tedirginlikler arasında oluşturulur. 'Gözlem hatası kovaryans matrisi', birleştirilmiş gözlemsel hataların (köşegen üzerinde) ve ölçümler arasındaki (köşegen dışında) ilişkili hataların büyüklüğünü temsil etmek için oluşturulur. Bu, yaygın uygulama örneğidir. Kalman filtreleme ve daha genel durum tahmini zamanla değişen sistemler için.

Mikrometeorolojide

girdap kovaryansı teknik, dikey rüzgar hızının ortalama değerden anlık sapması ile gaz konsantrasyonundaki anlık sapma arasındaki kovaryansın dikey türbülanslı akıların hesaplanmasında temel olduğu önemli bir atmosferik ölçüm tekniğidir.

Sinyal işlemede

Kovaryans matrisi, bir sinyalin spektral değişkenliğini yakalamak için kullanılır.[14]

İstatistik ve görüntü işlemede

Kovaryans matrisi kullanılır temel bileşenler Analizi veri ön işlemede özellik boyutunu azaltmak için.

Ayrıca bakınız

Referanslar

  1. ^ Pirinç, John (2007). Matematiksel İstatistik ve Veri Analizi. Belmont, CA: Brooks / Cole Cengage Learning. s. 138. ISBN  978-0534-39942-9.
  2. ^ Weisstein, Eric W. "Kovaryans". MathWorld.
  3. ^ Oxford İstatistik Sözlüğü, Oxford University Press, 2002, s. 104.
  4. ^ a b c d e Park, Kun Il (2018). İletişim Uygulamaları ile Olasılık ve Rassal Süreçlerin Temelleri. Springer. ISBN  978-3-319-68074-3.
  5. ^ Yuli Zhang, Huaiyu Wu, Lei Cheng (Haziran 2012). Varyans ve kovaryans hakkında bazı yeni deformasyon formülleri. 4. Uluslararası Modelleme, Tanımlama ve Kontrol Konferansı Bildirileri (ICMIC2012). s. 987–992.CS1 Maint: yazar parametresini kullanır (bağlantı)
  6. ^ "X ve Y'nin kovaryansı | STAT 414/415". Pennsylvania Eyalet Üniversitesi. Arşivlenen orijinal 17 Ağustos 2017. Alındı 4 Ağustos 2019.
  7. ^ Papoulis (1991). Olasılık, Rastgele Değişkenler ve Rassal Süreçler. McGraw-Hill.
  8. ^ Kuşatma uzmanı, Kyle. "Kovaryans ve Korelasyon". Huntsville'deki Alabama Üniversitesi. Alındı 4 Ağustos 2019.
  9. ^ a b Gubner, John A. (2006). Elektrik ve Bilgisayar Mühendisleri İçin Olasılık ve Rastgele Süreçler. Cambridge University Press. ISBN  978-0-521-86470-1.
  10. ^ Donald E. Knuth (1998). Bilgisayar Programlama Sanatı, cilt 2: Seminumerical Algoritmalar, 3. baskı, s. 232. Boston: Addison-Wesley.
  11. ^ Schubert, Erich; Gertz, Michael (2018). "(Eş) varyansın sayısal olarak kararlı paralel hesaplanması". 30. Uluslararası Bilimsel ve İstatistiksel Veritabanı Yönetimi Konferansı Bildirileri - SSDBM '18. Bozen-Bolzano, İtalya: ACM Press: 1–12. doi:10.1145/3221269.3223036. ISBN  9781450365055. S2CID  49665540.
  12. ^ Fiyat George (1970). "Seçim ve kovaryans". Doğa. 227 (5257): 520–521. doi:10.1038 / 227520a0. PMID  5428476. S2CID  4264723.
  13. ^ Harman, Ören (2020). "Bilim hayatı yansıttığı zaman: Fiyat denkleminin kökenleri üzerine". Phil. Trans. R. Soc. B. 375 (1797): 1–7. doi:10.1098 / rstb.2019.0352. PMC  7133509. PMID  32146891. Alındı 2020-05-15.
  14. ^ Sahidullah, Md .; Kinnunen, Tomi (Mart 2016). "Konuşmacı doğrulama için yerel spektral değişkenlik özellikleri". Dijital Sinyal İşleme. 50: 1–11. doi:10.1016 / j.dsp.2015.10.011.