Toplam veri - Aggregate data

Ayrı ayrı verilerin bir kombinasyonu olan toplu verilerin temel anlamını gösteren bir şema.

Toplam veri bireysel düzeydeki verilerin birleştirilmesiyle elde edilen üst düzey verilerdir. Örneğin, bir sektörün çıktısı, o sektördeki firmaların bireysel çıktılarının bir toplamıdır.[1] Toplu veriler istatistiklerde, veri ambarlarında ve ekonomide uygulanır.

Toplu veriler ile bireysel veriler arasında bir ayrım vardır. Toplu veriler, coğrafi alan, yıl, hizmet kuruluşu veya diğer yollarla ortalaması alınan bireysel verileri ifade eder.[2] Bireysel veriler, ayrı ayrı sonuçlara ayrılmıştır ve alt grup farklılıklarının tahmin edilmesi için analizler yapmak için kullanılır.[2]

Toplu veriler çoğunlukla araştırmacılar ve analistler, politika yapıcılar, bankalar ve yöneticiler tarafından birçok nedenden dolayı kullanılır. Politikaları değerlendirmek, süreçlerin eğilimlerini ve modellerini tanımak, ilgili içgörüler elde etmek ve stratejik planlama için mevcut önlemleri değerlendirmek için kullanılırlar. Çeşitli kaynaklardan toplanan toplu veriler, daha ileri analizler için karşılaştırmalı siyasi analiz ve APD bilimsel analizi gibi farklı çalışma alanlarında kullanılır. Toplu veriler ayrıca tıbbi ve eğitim amaçlı kullanılır. Toplu veriler yaygın olarak kullanılır, ancak aynı zamanda yanlış çizim de dahil olmak üzere bazı sınırlamalara eşlik eder. çıkarımlar ve 'olarak da adlandırılan yanlış sonuçlarekolojik yanlışlık ’.[3] "Ekolojik yanılgı", kullanıcıların bireysel düzeyde iki nicel değişken arasındaki ekolojik ilişkiler hakkında sonuç çıkarmasının geçersiz olduğu anlamına gelir.[3]

Başvurular

İçinde İstatistik, toplam veri çeşitli ölçümlerden birleştirilmiş verilerdir. Veriler toplandığında, gözlem grupları ile değiştirilir özet istatistikler bu gözlemlere dayanarak.[4]

İçinde Veri deposu, kullanımı toplu veriler, büyük veri kümelerini sorgulama süresini önemli ölçüde azaltır. Geliştiriciler, çeşitli ülkelerde Haftalık Satışlar gibi düzenli olarak kullanılan sorguları önceden özetler. boyutları örneğin öğe hiyerarşisine veya coğrafi hiyerarşiye göre.

İçinde ekonomi, toplam veri veya veri kümeleri Çok sayıda veya diğer daha bireysel verilerin birleşiminden oluşan yüksek düzeyli verilerdir, örneğin:

Başlıca kullanıcılar

Araştırmacılar ve analistler

Araştırmacılar, yaygın olanı anlamak için toplu verileri kullanır. ethos, sosyal gerçekliklerin ve sosyal bir organizasyonun özünü değerlendirmek, Araştırma ve sosyal sorunların doğası ile ilgili projeksiyonlar sağlar.[5] Toplu veriler, toplam düzeydeki iki farklı değişken arasındaki ilişkileri ve bireysel düzeyde bir toplu değişken ile bir özellik arasındaki bağlantıları araştırmakla ilgilendiklerinde araştırmacılar için yararlıdır.[2] Araştırmacılar aynı zamanda sistemlerin politikalarını, uygulamalarını ve ilkelerini, toplu verilerin yardımıyla eleştirel bir şekilde değerlendirmek, karşılık gelen verileri araştırmak için çaba sarf etmişlerdir. alaka ve etki.[5]

Kural koyucular

Toplu veriler, hükümetler tarafından daha etkili politikalar geliştirmek için kullanılır, çünkü bunlar, bir hükümetin vatandaşlarının talep ve ihtiyaçlarının farkında olma ve bir hükümetin sosyal düzeni etkili bir şekilde sürdürme şeklinin bir ölçüsü olarak hizmet eder.[5] Örneğin, dünyanın dört bir yanındaki hükümetler, Covid-19'a yanıt olarak analiz için toplu mobil konum verilerini kullanıyor. Toplu mobil konum verileri, aşağıdakilerin etkinliği hakkında bilgi sağlayabilir: sosyal mesafe hükümetler tarafından başlatılan önlemler. Hükümetler ayrıca olası “sıcak noktaları” ve bulaşma potansiyelini belirlemek için toplu verileri kullanır.[6]

Projelendirmenin yanı sıra etkililik Hükümet politikalarının doğasını değerlendirmek, kapsamını değerlendirmek, eğilimi tanımak ve stratejiler geliştirmek, kısa veya uzun vadeli politikalar hazırlamak amacıyla belirli bir olgunun veya sürecin modelini incelemek için toplu veri analizleri de alınır. kontrol veya önleme için etkili ve ilgili prosedürler.[5] Politika yapıcılar ayrıca, şirketlerin ve hanehalklarının ekonomik ve finansal faaliyetlerini değerlendirirken finansal toplam verileri kullanır çünkü bu veriler, aşağıdakilerle ilişkili risklerin belirlenmesine yardımcı olur: finansal istikrar. Politika yapıcılar, bir ülkenin ekonomik ve mali koşullarındaki gelişmeleri daha iyi anlamak için toplu verileri kullanabilir.[7]

Bankalar

Bankalar, önemli sayıda müşteriden toplu veriler toplar ve ardından kişisel bilgileri ortadan kaldırarak verileri anonim hale getirir. Bankaların toplu verileri kullanmasının ana nedeni, ekonomik eğilimleri tahmin etmek ve müşteri kümeleri hakkında içgörüler elde etmektir. Bankaların müşterilerin paylaşmasına izin verilmez. kişisel veri ancak toplu veriler, bankaların ticari müşterileriyle paylaşılabilir ve toplu veriler hakkında bilgi edinmek için aynı platformu kullanan diğer ortaklar tarafından erişilebilir.[8]

Avustralya'da Commonwealth Bank, ticari müşterilerine kart işlemlerinden elde edilen müşterileriyle ilgili anonim veriler sağlar. ANZ ayrıca, ticari müşterilerine milyonlarca ticari terminal işlemi ve ANZ kart işleminden toplanan anonim veriler sağlar.[8]

Birleşik Krallık'ta Entegre Acil Bakım Toplu Veri Toplama (IUC ADC), IUC etkinliği, performansı ve hizmet talebi hakkında kapsamlı bilgi sağlar. Verileri, İngiltere'de entegre acil bakım hizmetleri sunmaktan sorumlu öncü veri sağlayıcılardan elde edilmektedir.[9] Ulusal Sağlık Servisi (NHS) altında Sağlık ve Sosyal Bakım Bakanlığı İngiltere'deki (DHSC), bu toplu veri koleksiyonunun NHS 111 minimum veri setinin yerini alacağını belirtti. Ayrıca IUC istatistikleri için resmi bir kaynak olarak ve IUC ADC'nin Temel Performans Göstergelerini (KPI'ler) denetlemek için de kullanılacaktır.[10]

Yöneticiler

Ulusal veya bölgesel düzeyde mevcut ampirik veriler, yöneticiler ve entelektüellerin yanı sıra bir bölge veya toplumla ilgili endişeleri olan kişiler tarafından kullanılır. refah, referans kaynağı olarak.[5] Yöneticiler, özellikle, zaman ve mekana ilişkin sosyal tepkilerdeki boşlukları izlemek ve eylem önceliklerini dikte etmek için bir ulusun mevcut siyasi, dini, sosyal veya diğer atmosferindeki değerlendirmeler için toplu verileri kullanırlar. Bu değerlendirmeler, yöneticilere gelecekte faydalı olacak mevcut önlemleri değerlendirmede yardımcı olur. stratejik Planlama ve etkili düzeltici önlemlerle ilgili göstergeler sağlar.[5]

Kaynaklar ve toplama yöntemleri

Toplu veriler, aşağıdakiler de dahil olmak üzere çeşitli yazı ve kayıt türlerinin bir bileşimi olabilir: biyografi, otobiyografi, açıklayıcı hesaplar ve yazışmalar.[5] Örneğin, bir araştırmacı birden fazla mekanizma kullanarak toplu verileri toplar, harmanlar veya derler. sosyal Araştırma, dahil olmak üzere envanter, röportaj, bir fikir formu ve bir anket veya program. Resmi veya resmi olmayan kurumlar da saha düzeyinde bir departman içinde bulunan altyapıları kullanarak toplu verileri sürekli olarak toplar ve derler.[5]

Toplu veri kaynakları, verileri keşfetmek için araçlar olarak da kabul edilebilir. ABD'de, ABD verilerinin bir kısmı tablolar halinde sunulmuştur. Bu ABD toplu verileri için kaynak örnekleri şunları içerir: Amerika Birleşik Devletleri Nüfus Sayım Bürosu, Amerika Birleşik Devletleri İstatistik Özeti ve Social Explorer. Uluslararası Para Fonu veriler, World DataBank ve Penn Dünya Masası işlemsel ve uluslararası toplu veri kaynaklarının örnekleridir.[11]

Toplu verilerin kullanımı

Karşılaştırmalı siyasi analiz

Analistler yalnızca bireyin davranışına odaklanmadıkları için, toplu veriler karşılaştırmalı siyasi analizde kullanılır. Ayrıca seçim bölgeleri ve milletler de dahil olmak üzere alansal birimlerin davranışına odaklanırlar.[12] Siyasi faaliyet analizlerinde, ilgili olanlar gibi önemli veriler sanayileşme, kentleşme Kitle iletişim ağlarının yanı sıra, bireysel seviyelerde kolayca ifade edilmez. Olarak ifade edilirler kişi başına alan birimlerindeki varyasyonları kontrol etmek için terimler popülasyon boyutu.[12] Demografik, sosyo-ekonomik ve politik veriler uluslar tarafından toplanıp yayınlandığı için toplu veriler yaygın olarak mevcuttur. Bu, araştırmacıların ve analistlerin daha uzun trend çalışmaları yürütmelerini kolaylaştırır ve değişiklikleri ve gelişmeleri daha derin bir odak noktasına getirmelerini sağlar.[12]

APD bilimsel meta analizleri

Zaman ihtiyacı, önemli kaynaklar ve geniş uluslararası işbirliği, bireysel hasta verilerinin (IPD) kullanımını engelledi meta-analiz Bu, toplu hasta verilerine (APD) dayanan yayınlanmış meta analizlerin çoğuna yol açtı.[13] Tüm hastalarla ilgili tüm çalışmalardan veri elde etmek için, toplu hasta verileri, profesyonel toplantılarda sunulan tamamlanmış çalışmalardan toplanır, tıbbi literatür veya doğrudan bireysel araştırmacılar tarafından sağlanmıştır. Toplanan hasta verileri, aşağıdakiler de dahil olmak üzere kullanıcılar tarafından kullanılır. Cochrane İşbirliği, Amerika Birleşik Devletleri Önleyici Hizmetler Görev Gücü ve klinik uygulama kılavuzları için destek sağlayan birçok profesyonel topluluk. Toplu hasta verileri ayrıca meta analizlerin olay zamanı çalışmalarında da kullanılır, çünkü sonuçlar yatırımcıları, kaynak yoğun bireysel hasta verilerine dayanan daha fazla meta-analiz yapmaya devam etmeye değer konusunda bilgilendirebilir.[13]

Diğer kullanımlar

Sağlık hizmeti

Bir sağlık bilgi sisteminde toplu veriler, entegrasyon çok sayıda hastayla ilgili veriler. Toplu verilere dayalı olarak belirli bir hasta izlenemez. Bu birleştirilmiş veriler yalnızca sayılardır. Tüberküloz, Sıtma veya diğer hastalıklar. Sağlık tesisleri raporlar ve göstergeler oluşturmak ve sağlık sistemlerinde stratejik planlama yapmak için bu tür toplu istatistikleri kullanmak.[14] Toplu verilerle karşılaştırıldığında, hasta verileri, kişinin adı, yaşı, Teşhis ve tıbbi geçmiş. Hastaya dayalı veriler esas olarak, hastanın belirli bir tedaviye zaman içinde nasıl yanıt verdiği gibi bir hastanın ilerlemesini izlemek için kullanılır.[14]

COVID-ARC olarak da adlandırılan COVID-19 Veri Arşivi, küre. Araştırmacılar, uluslararası meslektaşlarının keşiflerine erişebilir ve hastalıkla mücadelede yer alan süreçleri kolaylaştırmak için işbirlikleri geliştirebilir.[15] Spesifik olarak, toplu sağlık hizmeti verilerinin kullanılması, sağlık hizmeti sağlayıcılarının, örneğin klinik verilerin kapsamlı görünümleri veya sürekli hasta kayıtları mümkün olduğunda, eyleme geçirilebilir klinik içgörüleri ortaya çıkarmasına olanak tanır.[15]

Eğitim

Öğrenci başarısı ile okul düzeyindeki müdahaleler arasındaki ilişkileri değerlendirmek için deneysel analizde okul düzeyinde toplu demografik veriler ve okul düzeyinde toplam başarı verileri gibi toplu veriler kullanılır.[16] Toplu veriler, deneysel olmayan analizlerde de kullanılabilir. gerileme süreksizlik analizi ve kesintili zaman serisi analizi. Bu deneysel olmayan analizlerde bireysel düzeyde verilere gerek yoktur. Örneğin, kesintiye uğramış zaman serileri analizi, okul düzeyindeki bir programın getirdiği etkiyi, bireysel düzeyde verilerin gerekli olmadığı program başlatılmadan önce ve sonra bir okulun başarısını karşılaştırarak tahmin eder.[16]

Sınırlamalar

Ayrıca bakınız: Birleştirilmiş verilerin zayıf yönleri

Bazılarının içindeki birimlerin ortalamasının alınması sürecinde küme veya bir ülke içinde, yanlış çıkarımlar yapma olasılığını artıran bilgi kaybolur.[17] Bilgi kaybı, verilerin bir araya getirilmesinin, yalnızca bir tür istatistiksel gürültü veya ölçüm hatasıymış gibi bireysel varyasyonu yok sayması nedeniyle oluşur.[18] Analiz için bireysel firma verileri veya toplu veriler kullanıldığında çıkarım da birbirinden farklıdır. Örneğin, ülke ortalamalarının hesaplanması, firma büyüklüğü, firma yaşı veya firma sahipliği konsantrasyonu gibi firmaya özgü değişkenleri hesaba katmaz, ancak bireysel ortalamaların hesaplanması. Toplu verilerden üretilen sonuçlar ile bireysel veriler arasında farklılıklar vardır.[17]

Ayrıca bir "ekolojik yanlışlık" sorunu da var. Kavram Robinson (1950) tarafından ortaya atıldı. Terimin anlamı, bireysel düzeydeki araçlar etrafındaki değişkenliğin, toplam araçları kapsayan değişkenlikten önemli ölçüde farklı olmasıdır.[18] Toplu kavramla, toplu verilerin bireysel eşdeğerleri dışındaki şeyler ifade edilir, bu da bireysel düzeyde sonuçların çıkarılamayacağı anlamına gelir.[3] Toplu veriler, bireysel düzeydeki verilere göre daha geniş uygulanabilirliğe sahip olsa da, araştırmacılar için analizlerle uğraşmak daha zordur. alt grup toplu veriler kullanıldığında sonuç verir. Sonunda bireysel bilgiler de gerekli olabilir. Büyüme modellemesi ve boyuna Toplu verilere dayalı modelleme de zordur çünkü değişkenler zamanla değişebilir.[2]

Diğer toplu veri türleri

Finansal toplu veriler

Finansal toplu veriler, aşağıdakiler hakkında toplu veri türüdür kredi ve para arzı Politika yapıcılar tarafından hem hanehalklarını hem de şirketlerin ekonomik ve mali faaliyetlerini değerlendirmede kullanılan Avustralya'da.[7]

Kredi toplamları

Kredi toplamları, hanehalklarının ve işletmelerin finansal aracılardan borçlanmalarının ölçümleridir. Proje yatırımları, varlık satın alımları veya nakit akışı yönetimi dahil olmak üzere işletmeler tarafından ödünç alınan fonların miktarı da kredi toplamları kullanılarak ölçülür.[7]

Parasal toplamalar

Parasal büyüklükler, bankacılık sisteminin işletmelere ve hanelere borçlu olunan paranın veya "paraya benzer" araçların ölçümleridir. "Para benzeri" bir araca örnek olarak, banka hesabı.[7]

Toplam nüfus sayımı verileri

İngiltere'de, sayım toplu veriler, Birleşik Krallık nüfus sayımlarından çıktı olarak üretilen verilerdir. Ülke nüfusunun sosyo-ekonomik ve demografik özellikleri hakkında bilgi sağlarlar. Kişilerin, hanehalkı sakinlerinin veya belirli özelliklere sahip belirli coğrafi alanlardaki ailelerin veya kişilerin ve yerlerin, nüfusların, ailelerin, sağlık konularının konularından alınan özelliklerin bileşiklerinin toplu veya özetlenmiş hesaplarının bir derlemesidir. etnik köken ve din, barınma ve iş.[19]

Toplu veriler, Birleşik Krallık nüfus sayımlarının çıktılarının bileşenleri olarak kullanılır. Nüfus sayım sonuçlarında verilen bilgilerin analizinden elde edilirler.[19] Toplam nüfus sayımı verileri, Birleşik Krallık'ın çeşitli yerlerinde nüfus özelliklerini karşılaştırmak ve açıklamak için kullanılır, çünkü tüm Birleşik Krallık'ta çeşitli coğrafi düzeylerde karşılaştırılabilir bilgiler sağlayabilirler. Toplam nüfus sayımı verileri akademik sektörde öğretim ve araştırma amaçlarının yanı sıra özel sektörde site konumu ve pazarlama için de kullanılmaktadır.[19]

Referanslar

  1. ^ Hashimzade, Nigar; Myles, Gareth; Siyah, John (2017-01-19). Ekonomi Sözlüğü. Oxford University Press. s. 4. doi:10.1093 / acref / 9780198759430.001.0001. ISBN  978-0-19-875943-0.
  2. ^ a b c d Jacob Robin (2016). "Sosyal Politika Araştırmalarında Toplu Yönetim Verilerini Kullanma". Planlama, Araştırma ve Değerlendirme Dairesi | ACF. s. 1-6. Alındı 2020-10-30.
  3. ^ a b c Starrin, Bengt; Hagquist, Curt; Larsson, Gerry; Svensson, Per-Gunnar (1993-06-01). "Topluluk türleri, sosyo-ekonomik yapı ve IHD mortalitesi - İsveç'in toplu verilerine dayalı bağlamsal bir analiz". Sosyal Bilimler ve Tıp. 36 (12): 1569–1578. doi:10.1016/0277-9536(93)90345-5. ISSN  0277-9536.
  4. ^ Verilerin toplanması ve yeniden yapılandırılması ("R in Action" kitabından bölüm 5.6, Manning Yayınları )
  5. ^ a b c d e f g h Shukla, K. S. (1982). "TOPLAM VERİLERİN ANALİZİ". Hindistan Hukuk Enstitüsü Dergisi. 24 (4): 756–762. ISSN  0019-5731.
  6. ^ "Mobil Konum Verileri ve Covid-19: Soru-Cevap". İnsan Hakları İzleme Örgütü. 2020-05-13. Alındı 2020-10-30.
  7. ^ a b c d Banka, Joel; Durrani, Kassim; Hatzvi, Eden (21 Mart 2019). "Avustralya'nın mali toplamlarında güncellemeler". Avustralya Merkez Bankası. Avustralya Merkez Bankası.
  8. ^ a b Stewart, Emily (2019-03-22). "Bankaların sizin hakkınızda pek çok bilgisi var - ve hepsini kendilerine saklamıyorlar - ABC Life". ABC Haberleri. Alındı 2020-10-30.
  9. ^ "İstatistikler» Entegre Acil Bakım Toplu Veri Toplama (IUC ADC) Deneysel İstatistikler 2019-20 ". www.england.nhs.uk. NHS İngiltere. Alındı 2020-10-30.
  10. ^ "Mart 2020 için Entegre Acil Bakım Toplu Veri Toplama (IUC ADC) (Deneysel)". GOV.UK. İngiltere, Birleşik Krallık. 14 Mayıs 2020. Alındı 2020-10-30.
  11. ^ Pencek, Bruce. "Araştırma Kılavuzları: Sosyal bilimler için veri kaynakları: Toplu veriler". guides.lib.vt.edu. Virginia Tech. Alındı 2020-10-30.
  12. ^ a b c Retzlaff, Ralph H. (1965). "Karşılaştırmalı Siyasi Analizde Toplu Verilerin Kullanımı". Siyaset Dergisi. 27 (4): 797–817. doi:10.2307/2128120. ISSN  0022-3816.
  13. ^ a b Lyman, Gary H .; Kuderer, Nicole M. (2005-04-25). "Toplu verilere dayalı meta analizlerin güçlü yönleri ve sınırlamaları". BMC Tıbbi Araştırma Metodolojisi. 5 (1): 14. doi:10.1186/1471-2288-5-14. ISSN  1471-2288. PMC  1097735. PMID  15850485.
  14. ^ a b "3.5 Bir HIS'deki Toplu ve Hasta verileri arasındaki fark". docs.dhis2.org. Alındı 2020-11-15.
  15. ^ a b Greenbaum, Zara (19 Ağustos 2020). "Bilim adamları, COVID-19 ile ilgili araştırmaları desteklemek için veri arşivi başlattı". HSC Haberleri. Alındı 2020-10-31.
  16. ^ a b Jacob, Robin T .; Goddard, Roger D .; Kim, Eun Sook (2014-03-01). "Okul Temelli Müdahalelerin Değerlendirilmesinde Toplu Verilerin Kullanımının Değerlendirilmesi: Değerlendirme Araştırması ve Kamu Kullanım Verilerine İlişkin Devlet Politikası için Çıkarımlar". Eğitimsel Değerlendirme ve Politika Analizi. 36: 44–66. doi:10.3102/0162373713485814.
  17. ^ a b Holderness, Clifford G. (2016-05-12). "Bireysel Davranışı Çıkarmak İçin Toplu Verileri Kullanma Sorunları: Hukuk, Finans ve Mülkiyet Konsantrasyonundan Kanıtlar". Kritik Finans İncelemesi. 5 (1): 1–40. doi:10.1561/104.00000028.
  18. ^ a b Pollet, Thomas V .; Stulp, Gert; Henzi, S. Peter; Barrett, Louise (2015). "Veri toplamanın ağırlığını ortadan kaldırmak: Bireysel düzeydeki gözlemsel verilerin havuzlanmasıyla ilgili istatistiksel konularla başa çıkmak için kavramsal bir kılavuz". Amerikan Primatoloji Dergisi. 77 (7): 727–740. doi:10.1002 / ajp.22405. ISSN  1098-2345.
  19. ^ a b c "Toplu nüfus sayımı kılavuzu". census.ukdataservice.ac.uk. Alındı 2020-10-31.