İstatistiksel kıyaslama - Statistical benchmarking

İçinde İstatistik, kıyaslama yardımcı bilgileri kullanmak için bir yöntemdir. örnekleme ağırlıkları kullanılan tahmin toplamları daha doğru tahmin etmek için işleyin.

Diyelim ki bir nüfus nerede her birim ${displaystyle k}$ "değeri" vardır ${displaystyle Y (k)}$ ile ilişkili. Örneğin, ${displaystyle Y (k)}$ bir çalışanın ücreti olabilir ${displaystyle k}$ veya bir öğenin maliyeti ${displaystyle k}$ . Toplamı tahmin etmek istediğimizi varsayalım ${displaystyle Y}$ hepsinden ${displaystyle Y (k)}$ . Bu yüzden bir örneklem of ${displaystyle k}$ , tüm örneklenenler için bir W (k) örnekleme ağırlığı alın ${displaystyle k}$ ve sonra özetle ${displaystyle W (k) cdot Y (k)}$ tüm numuneler için ${displaystyle k}$ .

Genellikle ağırlıklarda ortak olan bir özellik ${displaystyle W (k)}$ burada anlatılan şudur: toplam hepsi örneklenmiş ${displaystyle k}$ , bu durumda bu toplam, toplam birim sayısının bir tahminidir ${displaystyle k}$ popülasyonda (örneğin, toplam istihdam veya toplam öğe sayısı). Bir örneklemimiz olduğundan, popülasyondaki toplam birim sayısının bu tahmini gerçek popülasyon toplamından farklı olacaktır. Benzer şekilde, toplam tahmini ${displaystyle Y}$ (topladığımız yer ${displaystyle W (k) cdot Y (k)}$ tüm numuneler için ${displaystyle k}$ ) ayrıca gerçek popülasyon toplamından farklı olacaktır.

Gerçek nüfus toplamının ne olduğunu bilmiyoruz ${displaystyle Y}$ değer (eğer yapsaydık, örneklemenin bir anlamı olmazdı!). Yine de çoğu zaman toplamın ne olduğunu biliyoruz ${displaystyle W (k)}$ popülasyondaki tüm birimlerin üzerindedir. Örneğin, nüfusun toplam kazancını veya nüfusun toplam maliyetini bilmeyebiliriz, ancak genellikle toplam istihdamı veya toplam satış hacmini biliyoruz. Ve bunları tam olarak bilmesek bile, genellikle diğer kuruluşlar tarafından veya daha önceki zamanlarda, bu yardımcı miktarların çok doğru tahminleriyle yapılan anketler vardır. Bir popülasyonun önemli bir işlevi sayım daha küçük anketleri karşılaştırmak için kullanılabilecek verileri sağlamaktır.

Kıyaslama prosedürü, önce popülasyonun kıyaslama hücrelerine bölünmesiyle başlar. Hücreler, örneğin benzer ortak özellikleri paylaşan birimleri bir arada gruplayarak oluşturulur. ${displaystyle Y (k)}$ yine de nihai tahminlerin doğruluğunu artıran her şey kullanılabilir. Her hücre için ${displaystyle C}$ izin verdik ${displaystyle W (C)}$ hepsinin toplamı ol ${displaystyle W (k)}$ , toplamın tüm örneklem üzerinden alındığı yer ${displaystyle k}$ hücrede ${displaystyle C}$ . Her hücre için ${displaystyle C}$ izin verdik ${görüntü stili T (C)}$ hücre için yardımcı değer olun ${displaystyle C}$ , genellikle hücre için "karşılaştırma hedefi" olarak adlandırılan ${displaystyle C}$ . Sonra, bir kıyaslama faktörü hesaplıyoruz ${displaystyle F (C) = T (C) / W (C)}$ . Sonra tüm ağırlıkları ayarlıyoruz ${displaystyle W (k)}$ karşılaştırma faktörü ile çarparak ${displaystyle F (C)}$ , hücresi için ${displaystyle C}$ . Net sonuç, tahmin edilen ${displaystyle W}$ [toplanarak oluşturulur ${displaystyle F (C) cdot W (k)}$ ] şimdi karşılaştırma hedefi toplamına eşit olacak ${displaystyle T}$ . Ancak daha önemli fayda, toplamın tahmin edilmesidir. ${displaystyle Y}$ [toplanarak oluşturulur ${displaystyle F (C) cdot F (k) cdot Y (k)}$ ] daha doğru olma eğiliminde olacaktır.

Tabakalı örneklemeyle ilişki

Kıyaslama, benzerliklerinden dolayı bazen 'katmanlaşma sonrası' olarak adlandırılır. tabakalı örnekleme. İkisi arasındaki fark, tabakalı örneklemede karar vermemizdir. önceden her katmandan kaç birim örneklenecek (kıyaslama hücrelerine eşdeğer); karşılaştırmada, daha geniş popülasyondan birimler seçeriz ve her hücreden seçilen sayı bir şans meselesidir.

Katmanlı örneklemenin avantajı, her katmandaki örnek sayılarının istenen doğruluk sonuçları için kontrol edilebilmesidir. Bu kontrol olmadan, bir tabakada çok fazla numune olabilir ve diğerinde yeterli olmayabilir - aslında, bir numunenin içermesi mümkündür Hayır belirli bir hücrenin üyeleri, bu durumda kıyaslama başarısız olur çünkü ${displaystyle W (C) = 0}$ sıfıra bölme sorununa yol açar. Bu gibi durumlarda, kalan her hücrenin yeterli bir örnek boyutuna sahip olması için hücreleri birlikte 'daraltmak' gerekir.

Bu nedenle, kıyaslama genellikle tabakalı örneklemenin pratik olmadığı durumlarda kullanılır. Örneğin, bir telefon rehberinden kişileri seçerken, hangi yaşta olduklarını söyleyemiyoruz, bu nedenle örneği yaşa göre kolayca sınıflandıramayız. Bununla birlikte, bu bilgileri örneklenen insanlardan toplayarak demografik bilgilerle karşılaştırmalı değerlendirmemize izin verebiliriz.