Makine tarafından okunabilir belge - Machine-readable document

Bir makine tarafından okunabilir belge bir belge kimin içeriği tarafından kolayca işlenebilir bilgisayarlar. Bu tür belgeler ayırt edilir makine tarafından okunabilir veriler oluşturuldukları iş süreçlerini desteklemek için gerekli bağlamı sağlamak için yeterli yapıya sahip olmaları nedeniyle.

Tanım

Veri olmadan bağlam (dil kullanımı) anlamsızdır ve güvenilirliğin dört temel özelliğinden yoksundur iş kayıtları belirtilen ISO 15489 Bilgi ve dokümantasyon - Kayıt yönetimi:[1]

Bilginin büyük bir kısmı yapılandırılmamış veriler ve iş açısından bakıldığında, bunun "olgunlaşmamış" olduğu anlamına gelir, yani Seviye 1 (kaotik) Yetenek Olgunluk Modeli. Böyle olgunlaşmamışlık, verimsizliği teşvik eder, kaliteyi düşürür ve etkinliği sınırlar. Yapılandırılmamış bilgiler de aşağıdakiler için uygun değildir: kayıt yönetimi işlevler, yetersiz kanıt yasal amaçlar doğrultusunda, keşif içinde dava ve erişimi ve kullanımı rutin olarak gereksiz yere hantal hale getirir, sürekli iş süreçleri.

Makine tarafından okunabilirliğin en az dört yönü vardır:

  • İlk olarak, sözcükler veya tümcecikler, bilgisayar yazılımı ve / veya donanım mantığının kendilerine ayrı kavramsal öğeler olarak uygulanabilmesi için ayrı ayrı tasvir edilmelidir (etiketlenmelidir).
  • İkincisi, her bir öğenin anlam bilgisi, bilgisayarların, insanların anlamlarını ve potansiyel kullanımlarını ortak bir şekilde anlamalarına yardımcı olabilmesi için belirtilmelidir.
  • Üçüncüsü, tek tek unsurlar arasındaki ilişkiler de belirtilirse, bilgisayarlar bunlara otomatik olarak çıkarımlar uygulayabilir ve böylece insanları, özellikle de araştırma, keşif ve analiz amacıyla bunları anlamaya çalışma yükünden daha da kurtarabilir.
  • Dördüncüsü, unsurların meydana geldiği belgelerin yapıları da belirtilirse, insan anlayışı daha da güçlenir ve veriler, yasal ve ticari kalite amaçları için daha güvenilir hale gelir.

1983 gibi erken bir tarihte, ABD Devlet Hesap Verebilirlik Ofisi (GAO), makine tarafından okunabilir bilgilerin faydalarını vurgulamaya başladı.[2] Daha da erken, 1981'de GAO, ABD federal hükümetindeki yetersiz kayıt tutma uygulamaları sorununu rapor etmeye başladı.[3] Bu tür eksiklikler hükümete özgü değildir ve bilgi teknolojisindeki ilerlemeler, çoğu bilginin artık "dijital olarak doğduğu" ve dolayısıyla potansiyel olarak otomatik araçlarla çok daha kolay yönetildiği anlamına gelir.[4] Bununla birlikte, 2010 yılında Kongre'ye verdiği ifadede, GAO elektronik kayıtların yönetilmesiyle ilgili sorunların altını çizdi ve yakın zamanda, GAO, Yürütme Şube kurumlarının kayıt yönetimi gereksinimlerini karşılamadaki performansındaki yetersizlikleri rapor etmeye devam etti.[5][6] Dahası, büyük ve eskiden çok saygın bir denetim firmasından yirmi yıldan fazla bir süre sonra, Arthur Andersen, rekor imha skandalı nedeniyle ölümle karşılaştı, kayıt tutma uygulamaları 2016 Cumhurbaşkanlığı seçiminde ana konu haline geldi.

4 Ocak 2011'de Başkan Obama, H.R. 2142'yi imzaladı. Devlet Performansı ve Sonuçları Yasası (GPRA) 2010 Modernizasyon Yasası (GPRAMA), P.L. 111-352. GPRAMA Bölüm 10, ABD federal kurumlarının stratejik ve performans planlarını ve raporlarını aranabilir, makine tarafından okunabilir formatta yayınlamasını gerektirir.[7]Ek olarak, 2013 yılında Yönetici Kararı 13642, Genel olarak Devlet Bilgileri için Yeni Varsayılan Olarak Açık ve Makinede Okunabilir Yapma[8]28 Temmuz 2016'da Yönetim ve Bütçe Ofisi (OMB), ajansların açık, makine tarafından okunabilir formatları kullanması için Genelge A-130 yönergesinin revize edilmiş yayınına dahil edilerek,[9] ve "kamuya açık bilgileri, analizi ve mümkün olan en geniş amaç yelpazesi için yeniden kullanımı teşvik edecek şekilde" çevrimiçi yayınlamak,[10] bilginin hem halka açık hem de makine tarafından okunabilir olduğu anlamına gelir. 14 Ocak 2019'da Başkan Trump, H.R. 4174 yasasını imzaladı,[11] Açık Hükümet Verileri Yasası (OGDA), ajansların halka açık veri varlıklarını makine tarafından okunabilir formatta kullanıma sunma zorunluluğunu kanunla düzenler. 28 Haziran 2019'da A-11 Genelgesinde,[12] OMB, GPRAMA'nın 10. bölümüne uymaya başlama niyetini ifade etti.[13]

Bu tür bir politika yönünü destekleyen teknolojik ilerleme, daha verimli ve etkili yönetim ve makine tarafından okunabilir elektronik kayıtların kullanılmasını mümkün kılmaktadır. Belge odaklı veritabanları yarı yapılandırılmış veriler olarak da bilinen belge odaklı bilgileri depolamak, almak ve yönetmek için geliştirilmiştir. Genişletilebilir İşaretleme Dili (XML ) bir World Wide Web Konsorsiyumu (W3C ) Öneri her ikisi de olan bir formatta belgeleri kodlamak için kurallar belirlemek insan tarafından okunabilir ve makine tarafından okunabilir. Birçok XML düzenleyici araçlar geliştirilmiştir ve büyük bilgi teknolojisi uygulamalarının tümü olmasa da çoğu XML'i az ya da çok desteklemektedir. XML'in açık, standart, makine tarafından okunabilir bir format olması, uygulama geliştiricilerinin bunu yapmasını nispeten kolaylaştırır.

W3C'nin beraberindeki XML Şeması (XSD Tavsiye, bir XML belgesindeki öğelerin resmi olarak nasıl tanımlanacağını belirtir. XML şemalarının belirtimiyle ilgili olarak, Yapılandırılmış Bilgi Standartlarını Geliştirme Organizasyonu (OASIS) liderdir standartları geliştiren organizasyon. Ancak, birçok teknik geliştirici ile çalışmayı tercih ediyor JSON ve doğrulama, dokümantasyon ve etkileşim kontrolü için JSON verilerinin yapısını tanımlamak, JSON Şeması tarafından geliştirilmiştir İnternet Mühendisliği Görev Gücü (IETF).

Taşınabilir Döküman Formatı (PDF), belgeleri uygulama yazılımı, donanım ve işletim sistemlerinden bağımsız bir şekilde sunmak için kullanılan bir dosya biçimidir. Her bir PDF dosyası, metin, yazı tipleri, grafikler ve belgeyi görüntülemek için gereken diğer bilgiler dahil olmak üzere belgenin sunumunun tam bir açıklamasını içerir. PDF / A elektronik belgelerin arşivlenmesi ve uzun süreli korunmasında kullanılmak üzere özelleştirilmiş PDF'nin ISO standardına uygun bir sürümüdür. PDF / A-3, XML dahil olmak üzere diğer dosya biçimlerinin PDF / A uyumlu belgelere gömülmesine izin verir, böylece potansiyel olarak hem insan hem de makine tarafından okunabilirliğin en iyisini sağlar. W3C'ler XSL-FO (XSL Biçimlendirme Nesneleri) biçimlendirme dili, genellikle PDF dosyaları oluşturmak için kullanılır

Meta veriler, verilerle ilgili veriler, elektronik kaynakları düzenlemek, dijital kimlik sağlamak ve kaynakların arşivlenmesini ve korunmasını desteklemek için kullanılabilir. İyi yapılandırılmış, makine tarafından okunabilir elektronik kayıtlarda içerik, amaca uygun hem veri hem de meta veri olarak. Elektronik kayıt tutma sistemleri bağlamında, "yönetim" ve "meta veri" terimleri neredeyse eş anlamlıdır. Uygun meta veriler verildiğinde, kayıt yönetimi işlevleri otomatikleştirilebilir ve böylece delil bozma ve kayıtların diğer hileli manipülasyonları. Ayrıca, bu tür kayıtlar, süreci otomatikleştirmek için kullanılabilir. denetim veriler içinde tutulur veritabanları böylelikle ilgili tek arıza noktası riskini azaltır. Makyavelci kavramı tek gerçek kaynağı.

Blockchain (veritabanı) kurcalama ve revizyondan korunan, sürekli büyüyen kayıt listelerini korumak için yeni bir teknolojidir. Önemli bir özellik, merkezi olmayan bir sistemdeki her düğümün blok zincirinin bir kopyasına sahip olmasıdır, bu nedenle tek hata noktası manipülasyona tabi ve dolandırıcılık.

Ayrıca bakınız

Referanslar

  1. ^ "Web Kayıtlarını Yönetmeye İlişkin NARA Rehberi". Ulusal Arşivler. 15 Ağustos 2016.
  2. ^ "Bilgi Teknolojisinin Daha İyi Kullanımı Federal Evrak İşlerinin Yükünü Azaltabilir" (PDF). gao.gov. 1983-04-11. Alındı 2019-07-25.
  3. ^ "FEDERAL KAYIT YÖNETİMİ: Bir İhmal Tarihi". gao.gov. 1981-02-24. Alındı 2016-09-08.
  4. ^ "" Born Digital "Tanımlanması: Bir Deneme, Ricky Erway, OCLC Research" (PDF). oclc.org. 2010-11-30. Alındı 2016-09-08.
  5. ^ "BİLGİ YÖNETİMİ: Elektronik Kayıtları Yönetmenin Zorlukları, Bilgi Yönetimi ve İnsan Sermayesi Sorunları Direktörü Valerie C. Melvin'in Beyanı" (PDF). gao.gov. 2010-06-17. Alındı 2016-09-08.
  6. ^ "BİLGİ YÖNETİMİ: Resmi Kayıtları Yönetme Direktifinin Gerekliliklerini Karşılamak İçin Ek İşlemler Gerekiyor". gao.gov. 2015-05-14. Alındı 2016-09-08.
  7. ^ "GPRAMA SEC. 10. PERFORMANS PLANLARI VE RAPORLARIN BİÇİMİ". congress.gov. 2011-01-04. Arşivlenen orijinal 2016-04-13 tarihinde. Alındı 2016-09-08.
  8. ^ "Açık, standart, makine tarafından okunabilir Strateji Biçimlendirme Dili biçiminde Yönetici Siparişi 13642". whitehouse.gov. 2013-05-09. Arşivlenen orijinal 2016-03-03 tarihinde. Alındı 2016-09-08.
  9. ^ "StrategicPlan Circular No. A-130, Stratejik Kaynak Olarak Bilgiyi Yönetme, Hedef d.5.a: Birlikte Çalışabilirlik, API'ler ve Makine Okunabilirliği".
  10. ^ "StrategicPlan Circular No. A-130, Stratejik Bir Kaynak Olarak Bilgiyi Yönetmek, Hedef e.2.a: Yayın".
  11. ^ Ryan, Paul D. (14 Ocak 2019). "Metin - H.R.4174 - 115. Kongre (2017-2018): 2018 Kanıta Dayalı Politika Yapma Yasasının Temelleri". www.congress.gov.
  12. ^ "BÜTÇENİN HAZIRLANMASI, SUNULMASI VE UYGULANMASI" (PDF). whitehouse.gov. 2019-06-28. Alındı 2019-07-25.
  13. ^ "StrategicPlan Circular No. A-130, Stratejik Bir Kaynak Olarak Bilgiyi Yönetme, Hedef Makine Tarafından Okunabilirlik".

Dış bağlantılar