Yapılandırılmış belge - Structured document

Bir yapılandırılmış belge bir elektronik belge bir yöntem nerede biçimlendirme belgenin tamamını ve bir kısmını biçimlendirmelerinin ötesinde çeşitli anlamlara sahip olarak tanımlamak için kullanılır. Örneğin, yapılandırılmış bir belge belirli bir bölümü "Helvetica koyu 24" veya "girintili Courier" yerine "bölüm başlığı" (veya "kod örneği" veya "dörtlü") olarak tanımlayabilir. Bu tür bölümler genel olarak bir belgenin "bileşenleri" veya "öğeleri" olarak adlandırılır.

Genel Bakış

Yapılandırılmış belgeler genellikle yalnızca biçimlendirme için değil, çeşitli işleme amaçları için kullanılabilen şeyleri etiketlemeye odaklanır. Örneğin, "bölüm başlığı" veya "vurgu" ifadesinin açık olarak etiketlenmesi, yalnızca "Helvetica koyu 24" veya "italik" ten çok, görme engelliler için sistemler için çok daha kullanışlıdır. Aynı şekilde, bir teknik bilgi sayfasındaki birçok öğenin anlamlı şekilde etiketlenmesi, veritabanları, arama sistemleri, çevrimiçi kataloglar vb. İle çok daha iyi entegrasyon sağlar.

Yapılandırılmış belgeler genellikle en azından hiyerarşik yapıları, örneğin listeleri destekler, yalnızca liste öğelerini değil; bölümler, sadece bölüm başlıkları değil; ve benzeri. Bu, biçimlendirmeye yönelik sistemlerle tam bir tezat oluşturuyor. Üst düzey sistemler ayrıca birden fazla bağımsız ve / veya örtüşen bileşen setini destekler.[1]

Yapılandırılmış belge sistemleri, genellikle bileşen türlerini ve bunların nasıl birleştirilebileceğini tanımlayan açık kurallar oluşturmaya izin verir. Böyle bir kural kümesine benzer şekilde "şema" denir. veritabanı şemaları. Bunları belirtmek için birkaç resmi dil vardır, örneğin XSD, NG rahatla, ve Schematron. Şemanın kurallarına uyan yapılandırılmış bir belge genellikle "bu şemaya göre geçerli" olarak adlandırılır. Bazı sistemler, rasgele tür ve kombinasyon bileşenlerine sahip belgeleri de destekler, ancak yine de bu bileşenlerin nasıl tanımlanacağına dair sözdizimsel kurallara sahiptir.

Lie ve Saarela "Standart Genelleştirilmiş Biçimlendirme Dili (SGML), yapılandırılmış belgeler kavramına öncülük etmiştir ",[2] gibi daha önceki sistemler Katip, Arttırma, ve FRESS birçok yapılandırılmış belge özelliği ve yeteneği sağladı ve SGML'nin yavruları XML şimdi tercih ediliyor.

Yapılandırılmış belgeler için çok yaygın olarak kullanılan bir temsil, HTML tarafından tanımlanan ve açıklanan bir şema W3C. Ancak, HTML yalnızca paragraf, başlık ve kod gibi anlam odaklı bileşenler için etiketlere sahip değildir; aynı zamanda italik, kalın ve çoğu tablo gibi format odaklı olanlar. Uygulamada, HTML bazen yapılandırılmış bir belge sistemi olarak kullanılır, ancak genellikle bir biçimlendirme dili olarak kullanılır.

Birçok alan, ortaklaşa geliştirdikleri alana özgü şemalar aracılığıyla yapılandırılmış belgeler kullanır, örneğin JATS dergi yayıncılığı için, TEI edebi belgeler için, UBL ve EDI iş değişimi için, XTCE uzay aracı telemetrisi için, DİNLENME Web arayüzleri ve daha fazlası için. Tüm bu durumlar, aşağıdakilere göre belirli şemaları kullanır: XML.

XML Web'deki yapılandırılmış belgeler ve veriler için evrensel biçimdir

Yapısal anlambilim

Yapılandırılmış belgeleri yazarken odak, bir belgenin mantıksal yapısını kodlamaktır; basılı sayfalar veya ekranlar aracılığıyla sunumuna daha az veya hiç açık çalışma adanmaz (bazı durumlarda, böyle bir kullanım bile beklenmez). Yapılandırılmış belgeler, belgenin türev formlarını çıkarmak ve sunmak için bilgisayar sistemleri tarafından kolayca işlenebilir. Örneğin çoğu Wikipedia makalesinde, belgenin gövdesindeki farklı başlık etiketlerinden otomatik olarak bir içindekiler tablosu oluşturulur. Çünkü SGML dönüşümü Oxford ingilizce sözlük Basılı sürümün italik kullanımına eklenen birçok farklı anlamı açıkça ayırt eden arama araçları, etimoloji, alıntılar ve diğer birçok ilgi çekici özelliğe dayalı girdileri alabilir. HTML sadece biçimlendirme bilgisi yerine yapısal bilgi sağladığında, görme engelli kullanıcılara kolaylıkla daha kullanışlı bir okuma arayüzü verilebilir. Seyahat şirketleri, seyahat planlarını sadece ekranlar yerine yapılandırılmış belgeler olarak sunduklarında, kullanıcı araçları gerekli bilgileri kolayca çıkarabilir ve bunları takvime veya diğer uygulamalara aktarabilir.

İçinde HTML bir belgenin mantıksal yapısının bir bölümü belge gövdesi olabilir; <body>, birinci düzey başlık içeren; <h1>ve bir paragraf; <p>.

<vücut><h1>Yapılandırılmış belge</h1><p>Bir <kuvvetli sınıf="selflink">yapılandırılmış belge</kuvvetli> bir <a href="/ wiki / Electronic_document" Başlık="Elektronik belge">elektronik belge</a> bir yöntem nerede <a href="/ wiki / Markup_language" Başlık="Biçimlendirme dili">biçimlendirme</a> belgenin tamamını ve bir kısmını biçimlendirmelerinin ötesinde çeşitli anlamlara sahip olarak tanımlamak için kullanılır.</p></vücut>

Yapılandırılmış belgelerin en çekici özelliklerinden biri, birçok bağlamda yeniden kullanılabilmeleri ve cep telefonlarında, TV ekranlarında, konuşma sentezleyicilerinde ve bunları işlemek için programlanabilen diğer herhangi bir cihazda çeşitli şekillerde sunulabilmesidir.

Diğer anlambilim

Daha büyük nesnelerle tamamen aynı anlamda "yapısal" olmayan metne başka bir anlam atfedilebilir, ancak kapsamı ve doğası hakkındaki iddiaları ifade ettiği için yine de "belge yapısı" olarak kabul edilir veya ontoloji bir belgenin sunumuyla ilgili talimatlardan ziyade bölümlerinin İçinde HTML yukarıdaki parça, <strong> öğesi, ekteki metnin vurgulu olduğu anlamına gelir. Görsel terimlerle, bu genellikle kalın olarak oluşturulur, tıpkı <b>; ancak bir konuşma arayüzü bunun yerine muhtemelen ses tonunu kullanır. Dönem anlamsal işaretleme gibi işaretlemeyi hariç tutar <b> Bu, görsel bir gösterime yönelik bir talimattan başka hiçbir anlamı doğrudan ifade etmemektedir (akıllı bir aracı, etiketin arkasında gizlenen yapısal bir anlamı ayırt edebilir). "Güçlü" etiket, belirli bir ortamda uygun sunumu tarif etmekten ziyade, içeriğinin soyut, yarı dilsel bir özelliğini etiketlemesi nedeniyle "açıklayıcı" veya "yapısal" dır.

HTML'deki diğer bazı yapısal etiketler şunları içerir: <abbr>, <acronym>, <address>, <cite>, <del>, <dfn>, <ins>, <kbd>, and <q>. Gibi diğer şemalar DocBook ve TEI çok daha geniş seçeneklere sahip.

Çapa <a> etiketi, aralık bölümü bölümü yerine, biraz farklı başka bir yapı türü, yani ara bağlantı veya çapraz referans yapısı için kullanılır. Bu kesinlikle bir yapıdır ve aslında aynı belirli yapıları her iki şekilde de ifade eden belgeler için alternatif işaretleme oluşturmak mümkündür (örneğin, aşma gezinme köprü sunuları yerine bölüm içeriklerini temsil etmek için).

HTML erken dönemlerden itibaren sunum semantiğini ifade eden etiketlere sahipti, örneğin cesur (<b>) veya italik (<i>) veya değiştirmek için yazı tipi boyutları veya sunum üzerinde başka etkileri olan.[3] Modern versiyonları biçimlendirme dilleri Bu tür işaretlemeyi, belirli sunumlarla eşleştirilen açıklayıcı biçimlendirme lehine caydırmak stil sayfaları gibi sistemlerin öncülüğünü yaptığı bir yöntem Katip ve FRESS. "İtalik" etiket adının kalın yazı sunumuyla eşleştirilmesi tamamen sezgisel olmasa da, farklı sunumlar üretmek için herhangi bir işaretlemeye, anlamsal veya sunumsal olarak farklı stil sayfaları eklenebilir.

Bağlam ve amaç

Prensip olarak, "yapıyı" oluşturan ve yapısız olan şey değişebilir. Özellikle tipografi ile ilgili bir kitapta, bir şeyi "italik" veya "kalın" olarak etiketlemek asıl mesele olabilir. Örneğin, belirli stillerin ne zaman kullanılacağına ilişkin bir tartışma, muhtemelen örnekler ve karşı örnekler vermek isteyecektir; bu, sunum düzyazı ile uyumlu değilse artık bir anlam ifade etmeyecektir. Benzer şekilde, bir belgenin belirli bir baskısı sadece içeriği için değil, aynı zamanda tipografik uygulaması için de ilgi çekici olabilir, bu durumda bu uygulamayı tarif etmek sadece arzu edilen değil, aynı zamanda gereklidir. Ancak bu sorun, belge yapısına özgü değildir; aynı zamanda dilbilgisi tartışılırken ve diğer birçok durumda dilbilgisinde de ortaya çıkar.

Ayrıca bakınız

Referanslar

  1. ^ DeRose, Steven (2004). Biçimlendirme Örtüşmesi: Bir İnceleme ve Bir At. Extreme Markup Languages ​​2004. Montréal. CiteSeerX  10.1.1.108.9959. Alındı 2014-10-14.CS1 bakimi: ref = harv (bağlantı)
  2. ^ Håkon Wium Lie; Janne Saarela (1998). "HTML, XML ve CSS kullanarak çok amaçlı yayınlama". W3.org. Bilgi İşlem Makineleri Derneği.
  3. ^ "Örnek bir HTML örneği". Alındı 5 Mart 2014.