OCR-A - OCR-A

OCR-A
OCR-A font.svg
KategoriSans Serif
Tasarımcı (lar)Amerikan Tipi Kurucular
Tarafından yaptırılanAmerikan Ulusal Standartlar Enstitüsü
Çıkış tarihi1968[1]
VaryasyonlarOCR-A Genişletilmiş
Yazı tipi örneği OCR A.svg
Örneklem

OCR-A bir yazı tipi 1968'de, bilgisayarın ilk günlerinde oluşturuldu optik karakter tanıma, sadece o günün bilgisayarları tarafından değil, insanlar tarafından da tanınabilecek bir yazı tipine ihtiyaç duyulduğunda.[2] OCR-A, tanınabilir karakterleri oluşturmak için basit, kalın vuruşlar kullanır.[3]Yazı tipi tek aralıklı (sabit genişlikli), glifleri yerleştirmek için gerekli yazıcıyla 0.254 santimetre (0.10 inç) ayrı ve okuyucunun arasındaki boşlukları kabul etmesi gerekir. 0.2286 santimetre (0.09 inç) ve 0.4572 santimetre (0.18 inç).

Standardizasyon

OCR-A yazı tipi, Amerikan Ulusal Standartlar Enstitüsü (ANSI) ANSI X3.17-1981 olarak. X3.4 o zamandan beri INCITS ve OCR-A standardı artık ISO 1073-1: 1976. OCR-A için DIN 66008 adında bir Alman standardı da vardır.[4]

Uygulamalar

1968'de, Amerikan Tipi Kurucular ABD Standartlar Bürosu tarafından belirlenen kriterleri karşılayan ilk optik karakter tanıma yazı tiplerinden biri olan OCR-A'yı üretti. Tasarım, bir makine tarafından kolayca okunabilecek kadar basittir, ancak insan gözünün okuması daha zordur.[5]

Metal türü yerini bilgisayar tabanlı dizgiye bırakırken, Tor Lillqvist Metafont OCR-A yazı tipini tanımlamak için.[ne zaman? ] Bu tanım daha sonra Richard B. Wales tarafından geliştirildi. Çalışmalarına şu adresten ulaşılabilir: CTAN.[6]

John Sauter, yazı tipinin ücretsiz sürümünü Microsoft Windows kullanıcıları için daha erişilebilir hale getirmek için Metafont tanımlarını TrueType kullanma potrace ve FontForge 2004 yılında.[7] 2007 yılında Gürkan Şengün, Debian Bu uygulamadan paket.[8] 2008'de. Luc Devroye, John Sauter'in uygulamasında dikey konumlandırmayı düzeltti ve küçük harf z adını sabitledi.[9]

Bağımsız olarak, Matthew Skala[10] kullanılan mftrace[11] dönüştürmek için Metafont 2006'da TrueType formatına tanımlar. 2011'de Metafont tanımlarını birlikte çalışmak için yeniden yazarak oluşturulan yeni bir sürümü yayınladı. METATYPE1, ara izleme adımı olmadan doğrudan ana hatlar oluşturmak. 27 Eylül 2012'de uygulamasını 0.2 sürümüne güncelledi.[12]

Bu ücretsiz OCR-A uygulamalarına ek olarak, birkaç satıcı tarafından satılan uygulamalar da vardır.

Kullanım

Optik karakter tanıma teknolojisi, bu kadar basit yazı tiplerinin artık gerekli olmadığı noktaya kadar ilerlemesine rağmen, OCR-A yazı tipi kullanımda kalmıştır. Kodlamasında kullanımı yaygın olmaya devam ediyor çek dünya çapında. Biraz kilit kutusu şirketler hala bir fatura iade formundaki borçlu olunan hesap numarası ve tutarının OCR-A'da yazdırılması konusunda ısrar ediyorlar.[13] Ayrıca alışılmadık görünümünden dolayı bazen reklam ve teşhir grafiklerinde kullanılmaktadır.

Özellikle televizyon dizilerindeki altyazılar için kullanılır. Kara liste ve ana başlıklar için Sahtekar. Ek olarak, film için OCR-A kullanılır 13 Saat: Bingazi'nin Gizli Askerleri.

Kod noktaları

Yazı tipi, bir dizi karakter şeklidir veya glifler. Bir bilgisayarın yazı tipini kullanması için, her glif bir kod noktası içinde karakter seti. OCR-A standartlaştırılırken, olağan karakter kodlaması, Bilgi değişimi için Amerikan Standart kodu veya ASCII. OCR-A'nın tüm glifleri ASCII'ye uymuyor ve beş karakter için, ikinci bir yazı tipine ihtiyaç olduğunu düşündüren alternatif glifler vardı. Bununla birlikte, kolaylık ve verimlilik için tüm gliflere, aksi takdirde kullanılmayacak olan kodlama noktalarına yerleştirilen ek karakterlerle ASCII kodlaması kullanılarak tek bir yazı tipinde erişilebilir olması bekleniyordu.

ASCII'nin modern soyundan gelen, Unicode, Ayrıca şöyle bilinir ISO 10646. Unicode ASCII içerir ve OCR karakterleri için özel hükümlere sahiptir, bu nedenle bazı OCR-A uygulamaları, karakter kodu atamaları konusunda Unicode'a bakmıştır.

Ön Unicode standart gösterimi

ISO standart ISO 2033: 1983 ve ilgili Japon Endüstri Standardı JIS X 9010: 1984 (orijinal olarak JIS C 6229-1984), OCR-A için karakter kodlamalarını tanımlar, OCR-B ve E-13B. OCR-A için, değiştirilmiş 7 bitlik bir ASCII kümesi tanımlarlar (aynı zamanda ISO-IR numarası ISO-IR-91) sadece büyük harfler, rakamlar, noktalama işaretleri ve sembollerin bir alt kümesi ve bazı ek semboller içerir.[14] Basitçe ihmal edilmenin aksine, ASCII'ye göre yeniden tanımlanan kodlar aşağıda listelenmiştir:

KarakterResimyerASCII'deYorumlar
£Diyez işareti0x23#BS 4730 ile eşleşir, Birleşik Krallık varyantı ISO 646.[15]
{Sol Kıvrımlı Parantez0x28(Bir ayraç gösterilmesine rağmen karakter adı hala "LEFT PARENTHESIS". Olağan sol ayraç ASCII kodu 0x7B atlanır.[14]
}Sağ Kıvrımlı Ayraç0x29)Bir küme ayracı gösterilmesine rağmen karakter adı hala "SAĞ EBEVEYZ" dir. Olağan sağ ayraç ASCII kodu 0x7D atlanır.[14]
OCR Kancası0x3C<
OCR Başkanı0x3E>
¥Yen Burcu0x5CMaçlar JIS X 0201. JIS X 9010'a dahildir, ancak ISO 2033 tarafından çıkarılmıştır.[14]
OCR Çatal0x5D]

Ek olarak, uzun dikey işaret (Uzun Dikey İşaret), ASCII dikey çubuğuna (|) karşılık gelen 0x7C'de kodlanmıştır.[14]

Unicode'da özel OCR-A karakterleri

Aşağıdaki karakterler kontrol amacıyla tanımlanmıştır ve artık "Optik Karakter Tanıma" Unicode aralığı 2440–245F:

ASCII ve Unicode'a dayalı özel OCR-A kod noktaları[16]
İsimResimMetinUnicode
OCR KancasıOCR KancasıU + 2440
OCR BaşkanıOCR BaşkanıU + 2441
OCR ÇatalOCR ÇatalU + 2442
OCR Ters çatalU + 2443
OCR Kemer tokasıU + 2444
OCR PapyonU + 2445

Boşluk, rakamlar ve aksansız harfler

OCR-A basamakları
OCR-A vurgusuz büyük harfler
OCR-A vurgusuz küçük harfler

OCR-A'nın tüm uygulamaları boşluk için U + 0020, ondalık basamaklar için U + 0030'dan U + 0039'a, vurgusuz büyük harfler için U + 0041'den U + 005A'ya ve vurgusuz küçük harfler için U + 0061'den U + 007A'ya kadar kullanır. harf harfleri.

Normal karakterler

Rakamlara ve aksansız harflere ek olarak, OCR-A'nın birçok karakterinin ASCII'de bariz kod noktaları vardır.Tüm OCR-A'nın aksanlı harfleri de dahil olmak üzere çoğu, Unicode'da bariz kod noktalarına sahiptir.

ASCII ve Unicode'a dayalı ek OCR-A kod noktaları
İsimGlifUnicode
Ünlem işaretiÜnlem işaretiU + 0021
Tırnak işaretiTırnak işaretiU + 0022
Numara işaretiNumara işaretiU + 0023
Dolar işaretiDolar işaretiU + 0024
Yüzde İşaretiYüzde İşaretiU + 0025
Ve işaretiVe işaretiU + 0026
Kesme işaretiKesme işaretiU + 0027
Sol ParantezSol ParantezU + 0028
Sağ ParantezSağ ParantezU + 0029
Yıldız işaretiYıldız işaretiU + 002A
Artı işaretiArtı işaretiU + 002B
VirgülVirgülU + 002C
Kısa Çizgi-EksiKısa Çizgi-EksiU + 002D
Tam Durdurma (Periyot)Tam Durdurma (Periyot)U + 002E
Solidus (Eğik çizgi)Solidus (Eğik çizgi)U + 002F
KolonKolonU + 003A
Noktalı virgülNoktalı virgülU + 003B
Daha Az İşaretDaha Az İşaretU + 003C
Eşittir İşaretiEşittir İşaretiU + 003D
Büyük İşaretBüyük İşaretU + 003E
Soru işaretiSoru işaretiU + 003F
TicariTicariU + 0040
Sol Köşeli ParantezSol Köşeli ParantezU + 005B
Ters Katı Hal (Ters Eğik Çizgi)Ters SolidusU + 005C
Sağ Köşeli ParantezSağ Köşeli ParantezU + 005D
Circumflex AccentCircumflex AccentU + 005E
Sol Kıvrımlı ParantezSol Kıvrımlı ParantezU + 007B
Sağ Kıvrımlı AyraçSağ Kıvrımlı AyraçU + 007D
Pound İşareti (Sterlin)Diyez işaretiU + 00A3
Yen BurcuYen BurcuU + 00A5
Dierezli Latin Büyük Harfi ADierezli Latin Büyük Harfi AU + 00C4
Üstünde Halkalı Latin A HarfiÜstünde Halkalı Latin A HarfiU + 00C5
Latin Büyük Harf AELatin Büyük Harf AEU + 00C6
Latin alfabesinde Tilde'li Büyük Harf NLatin alfabesinde Tilde'li Büyük Harf NU + 00D1
Latin Büyük Harfi O ve DierezLatin Büyük Harfi O ve DierezU + 00D6
Latin alfabesinde konturlu Büyük Harf OLatince Büyük Harf O ve İnmeU + 00D8
Latin alfabesinde Dierezli Büyük U HarfiLatin alfabesinde Dierezli Büyük U HarfiU + 00DC

Kalan karakterler

Linotip[17] OCR-A'nın kalan karakterlerini aşağıdaki gibi kodladı:

Ek OCR-A Karakterleri
İsimGlifUnicodeUnicode Adı
Uzun Dikey İşaretUzun Dikey İşaretU + 007CDikey çizgi

Ek karakterler

Tor Lillqvist ve Richard B. Wales'in çalışmalarından gelen yazı tipleri, ASCII karakter setini doldurmak için OCR-A'da olmayan dört karakteri tanımlar. Bu şekiller, OCR-A karakter şekilleriyle aynı stili kullanır. Onlar:

Ek ASCII Karakterleri
İsimGlifUnicode
Düşük HatDüşük HatU + 005F
Grave AccentGrave AccentU + 0060
Dikey çizgiDikey çizgiU + 007C
TildeTildeU + 007E

Linotype ayrıca ek karakterleri de tanımlar.[18]

İstisnalar

Bazı uygulamalar, bazı karakterler için yukarıdaki kod noktası atamalarını kullanmaz.

PrecisionID

OCR-A'nın PrecisionID uygulaması, aşağıdaki standart olmayan kod noktalarına sahiptir:[19]

  • U + 007E'de OCR Kancası
  • U + 00C1'de OCR Başkanı
  • U + 00C2'de OCR Çatal
  • U + 0080'de Euro İşareti

Barcodesoft

OCR-A'nın Barcodesoft uygulaması aşağıdaki standart olmayan kod noktalarına sahiptir:[20][21]

  • U + 0060'da OCR Kancası
  • U + 007E'de OCR Başkanı
  • U + 005F'de OCR Çatal
  • U + 007C'de Uzun Dikey İşaret (Linotipi ile uyumludur)
  • U + 0008'de Karakter Silme

Morovia

OCR-A'nın Morovia uygulaması aşağıdaki standart olmayan kod noktalarına sahiptir:[22]

  • U + 007E'de OCR Kancası (PrecisionID ile uyumludur)
  • U + 00F0'da OCR Koltuğu
  • U + 005F'deki OCR Çatal (Barcodesoft ile uyumludur)
  • U + 007C'de Uzun Dikey İşaret (Linotipi ile uyumludur)

IDAutomation

OCR-A'nın IDAutomation uygulaması aşağıdaki standart olmayan kod noktalarına sahiptir:[23]

  • U + 007E'de OCR Kancası (PrecisionID ile uyumludur)
  • U + 00C1'deki OCR Başkanı (PrecisionID ile uyumludur)
  • U + 00C2'de OCR Çatalı (PrecisionID ile uyumludur)
  • U + 00C3'te OCR Kemer Tokası

Başvurular

Yazı tipi standartları satıcıları

Ayrıca bakınız

Notlar

  1. ^ Adobe'den OCR-A fontunun arka planı
  2. ^ Microscan'den OCR-A Motivasyonu
  3. ^ "Gömülü Yazılım Mühendisliğinden OCR ile İlgili Arka Plan". Arşivlenen orijinal 2016-09-17 tarihinde. Alındı 2012-09-01.
  4. ^ Optik Karakter Tanıma için DIN 66008-1 Yazı Tipi A; Karakterler ve Nominal Boyutlar
  5. ^ Adobe'den OCR-A hakkında arka plan
  6. ^ CTAN'dan OCR-A için MetaFont kaynakları
  7. ^ John Sauter'in bu MetaFont kaynaklarından 2004 OCR-A yazı tipi
  8. ^ John Sauter'in SourceForge projesine dayanan font-ocr-a Debian paketi
  9. ^ Luc Devroye'nin John Sauter'in OCR-A uygulamasındaki değişiklikleriyle ilgili açıklaması
  10. ^ Matthew Skala'nın ana sayfası
  11. ^ Mftrace Debian paketi
  12. ^ Matthew Skala'nın MetaFont kaynaklarından aldığı 2012 OCR-A yazı tipi
  13. ^ Kilitli kutu hizmetinin açıklaması, not "Fatura, taranabilir Optik Karakter Tanıma (OCR) hattında bulunan hasta bilgilerini içeren bir fatura ve bir hesap özeti içerir. OCR hattı, kredi kartı ekstresi veya telefon faturasında bulunan ile benzerdir. "
  14. ^ a b c d e ISO / TC97 / SC2 (1985-08-01). Japonca OCR-A Grafik Karakter Seti (PDF). ITSCJ /IPSJ. ISO-IR-91.
  15. ^ BSI (1975-12-01). Birleşik Krallık 7 bit veri kodunun grafik karakterleri kümesi (PDF). ITSCJ /IPSJ. ISO-IR-4.
  16. ^ https://www.unicode.org/charts/PDF/U2440.pdf
  17. ^ Linotype'ın OCR-A yazı tipi: Karakterleri ve kodlamalarını görmek için Karakter Eşlemi seçin
  18. ^ Linotype'ın OCR-A Genişletilmiş yazı tipi: Karakter Eşlem'i ve ardından Tümünü göster'i seçin
  19. ^ OCR-A yazı tipinin PrecisionID uygulaması için PrecisionID Kullanıcı Kılavuzu
  20. ^ OCR-A yazı tipinin Barkod uygulaması için bilgi sayfası
  21. ^ Barkod yazı tipleri hakkında başka bir bilgi kaynağı
  22. ^ OCR-A yazı tipinin Morovia uygulaması için bilgi sayfası
  23. ^ OCR-A ve OCR-B yazı tiplerinin IDAutomation uygulaması için bilgi sayfası

Dış bağlantılar