Bilgi patlaması - Information explosion

bilgi patlaması miktarındaki hızlı artış yayınlanan bilgi veya veri ve bu bolluğun etkileri.[1] Mevcut veri miktarı arttıkça, sorun bilgiyi yönetmek daha zor hale gelir, bu da bilgi bombardımanı. Çevrimiçi Oxford İngilizce Sözlüğü, cümlenin Mart 1964'te kullanıldığını gösterir. Yeni Devlet Adamı makale.[2] New York Times Bu ifadeyi ilk olarak Walter Sullivan'ın 7 Haziran 1964'te yazdığı ve bu ifadeyi "çok tartışılan" olarak tanımladığı bir makalede editoryal içeriğinde kullandı. (s.11.) [3] İfadenin ilk kullanımı, 30 Nisan 1961'de New York Times'da yayınlanan bir IBM reklam ekinde görülüyor.[4] ve Amerikan Biyolojik Bilimler Enstitüsü Disiplinlerarası Konferans Programı Direktörü Frank Fremont-Smith tarafından, AIBS Bültenindeki Nisan 1961 makalesinde (s18.) [5]

Birçok sektör sağlık hizmetleri, süpermarketler ve hatta doğum belgesi bilgileri ve aşı kayıtları olan hükümetler gibi mevcut bilgi miktarında bu hızlı artışı görüyor.[6] Bu fenomenden etkilenen bir diğer sektör de gazetecilik. Geçmişte bilginin yayılmasından sorumlu olan böyle bir meslek, günümüzde aşırı bilgi bolluğu ile bastırılabilir.[7]

Çok sayıda elektronik bilgiden bilgi toplama teknikleri (ör. veri füzyonu yardımcı olabilir veri madenciliği ) 1970'lerden beri var olmuştur. Bu kadar miktarda bilgiyle uğraşmak için başka bir yaygın teknik, nitel araştırma.[8] Bu tür yaklaşımlar, daha kullanışlı ve aranması daha kolay olması için bilgiyi organize etmeyi, sentezlemeyi, sınıflandırmayı ve sistematik hale getirmeyi amaçlamaktadır.

Büyüme kalıpları

  • Dünyanın bilgi depolama kapasitesi, 1986'da 2,6 (optimal olarak sıkıştırılmış) eksabayttan 1993'te 15,8'e, 2000'de 54,5'in üzerine ve 2007'de 295 (optimal olarak sıkıştırılmış) eksabayta yükseldi. Bu, bir 730 MB'den daha azına eşdeğerdir. CD-ROM 1986'da kişi başı (kişi başı 539 MB), kabaca 4 CD-ROM 1993 kişi başı, 12 CD-ROM 2000 yılında kişi başına ve neredeyse 61 CD-ROM 2007'de kişi başına. Hayal edilen 404 milyar CD-ROM 2007'den itibaren Dünya için Ay ve bu mesafenin dörtte biri (CD başına 1,2 mm kalınlığında).[9]
  • Dünyanın tek yönlü bilgi alma teknolojik kapasitesi yayın yapmak ağlar 1986'da 432 eksabayt (optimal olarak sıkıştırılmış) bilgi, 1993'te 715 (en uygun şekilde sıkıştırılmış) eksabayt, 2000'de 1.200 (optimal olarak sıkıştırılmış) eksabayt ve 2007'de 1.900 idi.[9]
  • Dünyanın iki yönlü bilgi alışverişi için etkin kapasitesi telekomünikasyon ağlar 1986'da 0.281 eksabayt (optimal olarak sıkıştırılmış) bilgi, 1993'te 0.471, 2000'de 2.2 ve 2007'de 65 (optimal olarak sıkıştırılmış) eksabayttı.[9]

Kişiye özgü bilgilerdeki büyümeyi karakterize etme girişiminde kullanılan yeni bir metrik, megabayt / kişi cinsinden ölçülen kişi başına disk depolama alanıdır (DSP). megabayt 106 bayt ve kısaltılmış MB'dir). Global DSP (GDSP), bir yılda satılan yeni birimlerin toplam sabit disk sürücüsü alanının (MB cinsinden) Dünya nüfusu o yıl. GDSP ölçüsü, dünya nüfusu hakkında kişiye özel verileri toplamak için ne kadar disk depolamanın kullanılabileceğinin kaba bir ölçüsüdür.[6] 1983'te, tahmini toplam 90'lık bir milyon sabit disk terabayt dünya çapında satıldı; 30MB sürücüler en büyük pazar segmentine sahipti.[10] 1996'da 1 ve 2 ile toplam 160.623 terabayt olan 105 milyon sürücü satıldı gigabayt sektöre öncülük ediyor.[11] 2000 yılına gelindiğinde, sektöre öncülük eden 20GB diskle, yıl boyunca satılan sabit disklerin toplam 2.829.288 terabaytlık Rijit disk satışlarının 1997'de 34 milyar doları aşacağı tahmin edilmektedir.

Göre Latanya Sweeney, bugün veri toplamada üç eğilim var:

1 yazın. "Daha fazla topla" trendi olarak bilinen, toplanan alanların sayısındaki artış.

Tip 2. Mevcut bir toplu veri koleksiyonunu, "özel olarak toplama" eğilimi olarak bilinen kişiye özgü biriyle değiştirin.

3 yazın. "Yapabiliyorsanız toplayın" eğilimi olarak bilinen, kişiye özel yeni bir veri toplama başlatarak bilgi toplayın.[6]

İlgili terimler

Elektronik ortamda "bilgi" genellikle "veri" ile eşanlamlı olarak kullanıldığından, bilgi patlaması kavramıyla yakından ilgilidir veri seli (ayrıca seslendirildi veri baskını). Bazen terim bilgi seli de kullanılmaktadır. Bunların tümü temelde sürekli artan miktarda elektronik veri zaman birimi başına değiştirilir. Yönetilemeyen veri miktarları hakkındaki farkındalık, 1960'ların ortalarından beri daha güçlü veri işlemenin ortaya çıkmasıyla birlikte büyüdü.[12]

Zorluklar

Bilgi bolluğu çeşitli düzeylerde faydalı olabilse de, aşağıdaki gibi bazı sorunlar endişe verici olabilir. gizlilik, yasal ve etik kurallar, filtreleme ve veri doğruluğu.[13] Filtreleme, veri bilimcilerin işiyle ilgili olan çok fazla verinin ortasında yararlı bilgiler bulmayı ifade eder. Veri filtreleme gerekliliğinin tipik bir örneği (veri madenciliği ), önümüzdeki yıllarda EHR'lere sahip olacağından (Elektronik Sağlık Kayıtları ) hasta sayısı. Bu kadar çok bilgi mevcut olduğunda, doktorların kalıpları belirleyebilmesi ve hastanın teşhisi için önemli verileri seçebilmesi gerekecektir.[13] Öte yandan, bazı uzmanlara göre, bu kadar çok sayıda kamuya açık veriye sahip olmak, aslında anonim olan verileri sağlamayı zorlaştırıyor.[6]Dikkate alınması gereken bir diğer nokta ise verinin sahibi kim olacağı ve bunu ne sıklıkla ve ne kadar süreyle yayınlamak zorunda olduğu ile ilgili yasal ve etik yönergelerdir.[13]Bu kadar çok veri kaynağıyla, başka bir sorun da bunun doğruluğu olacaktır. Güvenilmeyen bir kaynağa, başkaları tarafından yeni bir veri kümesi sipariş ederek ve bilgilerde bir tekrara neden olarak meydan okunabilir.[13]Edward Huth'a göre, bir başka endişe de bu tür bilgilerin erişilebilirliği ve maliyetidir.[14] Erişilebilirlik oranı, ya maliyetleri düşürerek ya da bilginin faydasını artırarak iyileştirilebilir. Yazara göre maliyetlerin azaltılması, hangi bilgilerin uygun olduğunu değerlendiren ve daha organize bir şekilde toplayan dernekler tarafından yapılabilir.

Web sunucuları

Ağustos 2005 itibarıyla 70 milyonun üzerinde web sunucuları.[15] Eylül 2007 itibariyle 135 milyondan fazla web sunucusu vardı.[16]

Bloglar

Göre Technorati, sayısı bloglar Nisan 2006 itibarıyla toplam 35,3 milyon blog ile yaklaşık 6 ayda bir iki katına çıkar.[17] Bu, erken dönemlerin bir örneğidir. lojistik büyüme, büyümenin yaklaşık olduğu yerde üstel, çünkü bloglar yeni bir yeniliktir. Blog sayısı olası üreticilerin (insanlar) sayısına yaklaştıkça, doygunluk meydana gelir, büyüme düşer ve blogların sayısı sonunda sabitlenir.

Ayrıca bakınız

Referanslar

  1. ^ Hilbert, M. (2015). Küresel bilgi Patlama:https://www.youtube.com/watch?v=8-AqzPe_gNs&list=PLtjBSCvWCU3rNm46D3R85efM0hrzjuAIg. Dijital Teknoloji ve Sosyal Değişim [California Üniversitesi'nde Çevrimiçi Açık Kurs] şu adresten ücretsiz olarak alınabilir: https://canvas.instructure.com/courses/949415
  2. ^ "Bilgi." http://dictionary.oed.com. 4 Ocak 2008'de erişildi
  3. ^ https://www.nytimes.com/1964/06/07/u-s-will-remove-reactor-in-arctic.html?_r=0
  4. ^ http://www-03.ibm.com/ibm/history/ibm100/us/en/icons/translation/
  5. ^ Davis, Keith (1973). "İşletmelerin Sosyal Sorumluluk Üstlenmesinin Davası ve Karşıtı". Academy of Management Journal. 16 (2): 312–322. doi:10.2307/255331. JSTOR  255331.
  6. ^ a b c d Sweeney, Latanya. "Bilgi patlaması." Gizlilik, açıklama ve veri erişimi: İstatistik ajansları için teori ve pratik uygulamalar (2001): 43-74.
  7. ^ Fuller, Jack. Haberlere ne oluyor: Gazetecilikte bilgi patlaması ve kriz. Chicago Press Üniversitesi, 2010.
  8. ^ Binbaşı, Claire Howell ve Maggi Savin-Baden. Nitel araştırma sentezine giriş: Sosyal bilim araştırmalarında bilgi patlamasını yönetmek. Routledge, 2010.
  9. ^ a b c "The Womartinhilbert.net/WorldInfoCapacity.html" çalışmaya ücretsiz erişim " ve "video animasyonu".
  10. ^ Disk / Trend raporu 1983, ”Bilgisayar Haftası. Mountain View, CA. (46) 11/11/83.
  11. ^ Sabit disk sürücü satışları 1997'de 34 milyar doları aştı, ”Disk / Trend News. Mountain View, CA: Disk / Trend, Inc., 1997.
  12. ^ Google Books Ngram görüntüleyici burada bahsedilen terimler için
  13. ^ a b c d Berner, Eta S. ve Jacqueline Moss. "Yaklaşan hasta bilgi patlaması için bilişim zorlukları." Amerikan Tıp Bilişimi Derneği Dergisi 12.6 (2005): 614-617.
  14. ^ Huth, Edward J. "Bilgi patlaması." New York Tıp Akademisi Bülteni 65.6 (1989): 647.
  15. ^ Robert H Zakon (15 Aralık 2010). "Hobbes'un İnternet Zaman Çizelgesi 10.1". zakon.org. Alındı 27 Ağustos 2011.
  16. ^ "Ağustos 2011 Web Sunucusu Anketi". netcraft.com. Ağustos 2011. Alındı 27 Ağustos 2011.
  17. ^ "Blogosphere'in Durumu, Nisan 2006 Bölüm 1: Blogosphere Büyümesi Üzerine". Sifry'nin Uyarıları (sifry.com). 17 Nisan 2006. Arşivlenen orijinal 9 Ocak 2013 tarihinde. Alındı 27 Ağustos 2011.

Dış bağlantılar