Tasarım matrisi - Design matrix

İçinde İstatistik, bir tasarım matrisi, Ayrıca şöyle bilinir model matrisi veya regresör matrisi ve genellikle şu şekilde gösterilir X, bir matris değerlerinin açıklayıcı değişkenler nesneler kümesi. Her satır, değişkenlere karşılık gelen ardışık sütunlar ve o nesne için belirli değerleri ile ayrı bir nesneyi temsil eder. Tasarım matrisi bazı durumlarda kullanılır istatistiksel modeller örneğin genel doğrusal model.[1][2][3] İçerebilir gösterge değişkenleri (birler ve sıfırlar) grup üyeliğini gösteren ANOVA veya değerlerini içerebilir Sürekli değişkenler.

Tasarım matrisi, bağımsız değişkenler (aynı zamanda açıklayıcı değişkenler olarak da adlandırılır) bir yanıt değişkeni üzerinde gözlemlenen verileri açıklamaya çalışan istatistiksel modellerde (genellikle bağımlı değişken ) açıklayıcı değişkenler açısından. Bu tür modellerle ilgili teori, tasarım matrisini içeren matris manipülasyonlarından önemli ölçüde yararlanır: örneğin bkz. doğrusal regresyon. Bir tasarım matrisi kavramının dikkate değer bir özelliği, bir dizi farklı modeli temsil edebilmesidir. deneysel tasarımlar ve istatistiksel modeller, ör. ANOVA, ANCOVA, ve doğrusal regresyon.[kaynak belirtilmeli ]

Tanım

Tasarım matrisi bir matris olarak tanımlanır öyle ki (jinci i sütunuinci Dizisi ) j'nin değerini temsil ederinci i ile ilişkili değişkeninci nesne.

Bir regresyon modeli olan doğrusal kombinasyon açıklayıcı değişkenlerin% 50'si bu nedenle matris çarpımı yoluyla şu şekilde temsil edilebilir:

nerede X tasarım matrisidir, modelin katsayılarının bir vektörü (her değişken için bir tane) ve y her nesne için tahmin edilen çıktıların vektörüdür.

Boyut

matris nın-nin veri boyut var n-tarafından-p, nerede n gözlemlenen örneklerin sayısı ve p değişkenlerin sayısıdır (özellikleri ) tüm örneklerde ölçülmüştür.[4][5]

Bu gösterimde, farklı satırlar tipik olarak bir deneyin farklı tekrarlarını temsil ederken, sütunlar farklı veri türlerini temsil eder (örneğin, belirli araştırmalardan elde edilen sonuçlar). Örneğin, 10 kişinin sokaktan çekilip dört soru sorulduğu bir deney yapıldığını varsayalım. Veri matrisi M 10 × 4 matris olacaktır (10 satır ve 4 sütun anlamına gelir). Satırdaki veri ben ve sütun j Bu matrisin cevabı olur ben inci kişiye j inci soru.

Örnekler

Aritmetik ortalama

İçin tasarım matrisi aritmetik ortalama bir sütun olanların vektörü.

Basit doğrusal regresyon

Bu bölüm bir örnek verir basit doğrusal regresyon —Yani yalnızca tek bir açıklayıcı değişkenle — yedi gözlemle regresyon. Yedi veri noktası {yben, xben}, için ben = 1, 2,…, 7. Basit doğrusal regresyon modeli

nerede ... y-kestirmek ve regresyon çizgisinin eğimidir. Bu model aşağıdaki gibi matris formunda gösterilebilir:

tasarım matrisindeki 1'lerin ilk sütunu, y-İkinci sütun, x- karşılık gelen ile ilişkili değerler y-değerler.

Çoklu regresyon

Bu bölüm bir örnek içerir çoklu regresyon iki ortak değişkenle (açıklayıcı değişkenler): w ve xYine, verilerin yedi gözlemden oluştuğunu ve gözlemlenen her değer için tahmin edilebileceğini varsayalım (), değerler wben ve xben iki ortak değişken de gözlenir. Dikkate alınacak model

Bu model aşağıdaki gibi matris terimleriyle yazılabilir:

Burada sağ taraftaki 7 × 3 matris tasarım matrisidir.

Tek yönlü ANOVA (hücre, model anlamına gelir)

Bu bölüm, tek yönlü varyans analizine sahip bir örnek içerir (ANOVA ) üç grup ve yedi gözlem ile. Verilen veri setinde birinci gruba ait ilk üç gözlem, ikinci gruba ait sonraki iki gözlem ve üçüncü gruba ait son iki gözlem bulunmaktadır.Uyacak model her grubun sadece ortalaması ise, o zaman model

hangisi yazılabilir

Bu modelde ortalamasını temsil eder inci grup.

Tek yönlü ANOVA (referans grubundan ofset)

ANOVA modeli, her grup parametresi olarak eşdeğer şekilde yazılabilir bazı genel referanslardan bir sapma. Tipik olarak bu referans noktası, söz konusu gruplardan biri olarak kabul edilir. Bu, çok sayıda tedavi grubunu bir kontrol grubuyla karşılaştırma bağlamında anlamlıdır ve kontrol grubu "referans" olarak kabul edilir. Bu örnekte, grup 1 referans grubu olarak seçilmiştir. Bu nedenle uygun olacak model

kısıtlama ile sıfırdır.

Bu modelde referans grubunun ortalamasıdır ve gruptan farkı referans grubuna. matrise dahil edilmemiştir çünkü referans grubundan (kendisinden) farkı mutlaka sıfırdır.

Ayrıca bakınız

Referanslar

  1. ^ Everitt, B. S. (2002). Cambridge İstatistik Sözlüğü (2. baskı). Cambridge, İngiltere: Cambridge University Press. ISBN  0-521-81099-X.
  2. ^ Box, G.E.P.; Tiao, G. C. (1992) [1973]. İstatistiksel Analizde Bayesci Çıkarım. New York: John Wiley and Sons. ISBN  0-471-57428-7. (Bölüm 8.1.1)
  3. ^ Timm, Neil H. (2007). Uygulamalı Çok Değişkenli Analiz. Springer Science & Business Media. s. 107.
  4. ^ Johnson, Richard A; Wichern, Dean W (2001). Uygulamalı Çok Değişkenli İstatistiksel Analiz. Pearson. sayfa 111–112. ISBN  0131877151.
  5. ^ "Çok Değişkenli İstatistikler için Temel Kavramlar s.2" (PDF). SAS Enstitüsü.

daha fazla okuma

  • Verbeek Albert (1984). "Regresyonda Model Seçiminin Geometrisi". Dijkstra'da Theo K. (ed.). Yanlış Spesifikasyon Analizi. New York: Springer. s. 20–36. ISBN  0-387-13893-5.