OCRFeeder - OCRFeeder - Wikipedia

OCRFeeder
OCRFeeder logosu w yazı.svg
Ocrfeeder.jpeg
Geliştirici (ler)Joaquim Rocha (Igalia )
İlk sürümMart 2009; 11 yıl önce (2009-03)
Kararlı sürüm
0.8.3 / 8 Mart 2020; 9 ay önce (2020-03-08)[1]
Depo Bunu Vikiveri'de düzenleyin
YazılmışPython, PyGTK
İşletim sistemiLinux, Unix benzeri
UygunArayüz: Çek, Danimarka dili, Almanca, ingilizce, İspanyol, Fransızca, Galiçyaca, İtalyan, Norveççe (bokmål), Portekizce, Romence, Slovence, İsveççe, Çince[2]
Tanıma: kullanılan OCR motoruna bağlıdır
TürOptik karakter tanıma
LisansGPL (ücretsiz yazılım )
İnternet sitesiwiki.gnome.org/ Uygulamalar/ OCRFeeder

OCRFeeder bir optik karakter tanıma için süit GNOME gibi hemen hemen tüm komut satırı OCR motorlarını da destekleyen CuneiForm, GOCR, Ocrad ve Tesseract. Kağıt belgeleri dijital belge dosyalarına dönüştürür ve görme engelli kullanıcılar için erişilebilir hale getirmeye hizmet edebilir.

OCRFeeder ücretsiz ve açık kaynaklı yazılım şartlarına tabi GNU Genel Kamu Lisansı (GPL) sürüm 3 veya üzeri. İçin mevcuttur Linux ve diğeri Unix benzeri işletim sistemleri.

Tarih

Joaquim Rocha, OCRFeeder'ı tanıtıyor Gran Canaria Masaüstü Zirvesi Temmuz 2009'da

OCRFeeder, bir yüksek lisans tezi içinde bilgisayar Bilimi Joaquim Rocha,[3] daha sonra kim tarafından işe alındı Igalia, S.L. ve orada gelişim devam ediyor.[4][5]

İlk versiyon Mart 2009'da yayınlandı.[6] OCRFeeder projesi başlangıçta yayınlandı ve Google Code, geçici olarak kullanıldı Devasa[7] ve artık GNOME altyapısını kullanıyor.[8] 5 Nisan 2010'dan bu yana, resmi Debian depolarına bir yazılım paketi eklenmiştir.[9]

30 Temmuz 2010 tarihli 0.7 sürümü, OCRFeeder içinden tarayıcı erişimi için etkinleştirilen 0.7.1 (8 Kasım 2010) görüntü ön işleme özelliklerini getirdi.

Özellikleri

OCRFeeder, GNOME için tasarlanmış basit bir grafik kullanıcı arayüzüne sahiptir. İnsan Arayüzü Yönergeleri. Belge Düzeni Analizi ve düzeni uygun çıktı formatlarına aktarır. İçerik alanlarını arar, ana hatlarını çizer ve içerik türünü (metin veya görüntü) tahmin eder ve OCR arka ucu aracılığıyla metin alanlarını işler. Neredeyse tüm komut satırı OCR motorunu arka uç olarak kullanabilir ve tüm popüler ücretsiz motorlar için otomatik algılama ve otomatik yapılandırma özelliklerine sahiptir. OCR arka uçları, otomatik olarak yapılandırılabilir, gerekli komut satırı bir GUI diyaloğuna girilebilir veya doğrudan bir XML dosya. Eğriltme dahil tarama sonrası görüntü işleme yapılabilir.[10] Tüm tanıma sonuçları, istenen çıktı formatına kaydedilmeden önce incelenebilir ve düzenlenebilir. Oturumlar kaydedilebilir ve yüklenebilir. Süitte ayrıca yazım denetleyicisi.[11] OCRFeeder, OCR motoru tarafından döndürülen ham OCR sonuçlarının sonradan işlenmesi için yerleşik prosedürlere sahiptir. Tireleme kaldırılsa bile, yazdırılan metin satırlarında kalan bölümlemeyi kaldırabilir.

OCRFeeder bir GUI aracı olmasına rağmen, aynı zamanda Komut satırı modu (ocrfeeder-cli olarak), otomatik belge için yararlı bir araç olabilir toplu işlem.[12] Bu modda OCRFeeder, kullanıcının uygulamanın tercihlerinde ayarlayabileceği varsayılan OCR motorunu kullanır.[13][14]

Program şu dilde yazılmıştır: Python ve kullanır GTK + kütüphane (kullanarak PyGTK ).[12]Gibi davranır grafiksel başlangıç ​​aşaması diğer mevcut araçlar için. Örneğin, kendisini gerçek karakter tanıma yapmaz, ancak sistemde kurulu "OCR motoru" gibi harici programları kullanır. Otomatik olarak algılayabilir ve yapılandırabilir CuneiForm, GOCR, Ocrad ve Tesseract arka uç OCR motorları olarak.[15] Tarayıcılara şu yolla erişilir: AKLI BAŞINDA. Taranan görüntülerin sonradan işlenmesi için "Unpaper" komut satırı aracının entegrasyonu vardır,[12] PDF dosyaları diğer şeylerin yanı sıra Ghostscript arka uçta.

Giriş ve çıkış

OCRFeeder, verileri şuradan içe aktarabilir: PDF veya grafik dosyaları. 0.7.1a sürümünden, görüntülerin doğrudan tarayıcı cihazı.[11]

Sonuçlar kaydedilebilir HTML, OpenDocument, düz metin[16] veya PDF[17] dosya formatları. hOCR dosya çıktısı da planlanır.[3] İlk biçimlendirme, doğrudan program içinde yapılabilir.

Referanslar

  1. ^ "GNOME FTP arşivi, OCRFeeder 0.8.3 haber dosyası". Alındı 2020-04-12.
  2. ^ "GNOME GIT kaynak kodu deposu, LINGUAS dosyası". Alındı 2011-02-09.
  3. ^ a b "OCRFeeder - GNOME Live!". Alındı 2011-02-09.
  4. ^ "Ürün:% s". Igalia. Alındı 2012-11-24.
  5. ^ Rocha, Joaquim (2013/01/14). "Değişim rüzgarları". Alındı 2013-09-04.
  6. ^ OCRFeeder, Google Code
  7. ^ wiki.gnome.org 2. ve 3. revizyonlar arasındaki farklar
  8. ^ wiki.gnome.org - Düzeltmeler 5 ve 6 arasındaki farklar
  9. ^ Debian Değişiklik Günlüğü ocrfeeder (0.6.6 + dfsg1-1)
  10. ^ "GNOME GIT kaynak kodu deposu, HABER dosyası". Alındı 2011-02-03.
  11. ^ a b Rocha, Joaquim (2010-11-09). "OCRFeeder 0.7.1a sürümü yayınlandı". Alındı 2011-02-09.
  12. ^ a b c "GNOME GIT kaynak kodu deposu, README dosyası". Alındı 2011-02-09.
  13. ^ Μάνος (2011-03-22). "OCRFeeder 0.7.4: Ψηφιοποιήστε τα έγγραφα σας". OSArena. Alındı 2011-06-08.
  14. ^ Hejda, Václav (2011-05-26). "OCRFeeder - Užitečný rozpoznávač textu, který však neumí česky". LinuxEXPRES.cz. QCM s.r.o. Alındı 2011-06-08.
  15. ^ "GNOME GIT kaynak kodu deposu, configuration.py dosyası". Alındı 2011-02-03.
  16. ^ OCRFeeder Sürüm 0.7.4 Yeni Özellikler
  17. ^ Sürüm 0.7.6

Dış bağlantılar