CuneiForm (yazılım) - CuneiForm (software)

CuneiForm
Orijinal yazar (lar)Bilişsel Teknolojiler
Geliştirici (ler)Bilişsel Teknolojiler
İlk sürümKaynak 2 Nisan 2008; 12 yıl önce (2008-04-02)[1]
Kararlı sürüm
1.1 / 19 Nisan 2011; 9 yıl önce (2011-04-19)
YazılmışC ve C ++
İşletim sistemiÇapraz platform
TürOptik karakter tanıma
LisansÜcretsiz /BSD lisansları
İnternet sitesibaşlatma çubuğu.ağ/ cuneiform-linux Bunu Vikiveri'de düzenleyin

CuneiForm Bilişsel OpenOCR, Rus yazılım şirketi tarafından geliştirilen ücretsiz olarak dağıtılan açık kaynaklı bir OCR sistemidir Bilişsel Teknolojiler.

CuneiForm OCR, Bilişsel Teknolojiler Sistem, Rusya'da ve dünyanın geri kalanında en popüler tarayıcı, MFP ve yazılım modelleriyle geldi: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon , Olivetti vb.
Bilişsel Teknolojiler 2008'de programın kaynak kodlarını açtı.

Özellikleri

CuneiForm, kağıt belge ve görüntü dosyalarının elektronik kopyalarının, yapısını ve orijinal belge yazı tiplerini otomatik veya yarı otomatik modda değiştirmeden düzenlenebilir bir forma dönüştürmek için geliştirilmiş bir sistemdir. Sistem, elektronik belgelerin tek ve toplu olarak işlenmesi için iki bileşen içerir.

Sistem tarafından desteklenen dillerin listesi:

Ayrıca, sistem Rusça ve İngilizce karışımını desteklemektedir. Diğer karma dillerin tanınması sadece 2009'da Andrei Borovsky tarafından geliştirilen branşta destekleniyor.[2] Sistemin diğer dilleri tanıması için eğitilmesi zordur, çünkü her dil, yapısı ve geliştirme yöntemi geliştiriciler tarafından açıklanmayan bir veri dosyasıyla ilgilidir.

Tarih

1993 - Bilişsel Teknolojiler ile bir OEM sözleşmesi imzaladı Corel, Bilişsel tanıma kitaplığının Corel Draw 3.0 (ve sonraki sürümler), yayıncılık alanında popüler olan paket.

1994 - CuneiForm OCR ile Rusya'ya ithal edilen tüm tarayıcıların ekipmanı için Hewlett-Packard ile sözleşme imzalandı. Bu, bir Rus yazılım şirketiyle yapılan ilk HP sözleşmesiydi.

1995 - Japon şirketi Epson ile tarayıcılarına CuneiForm OCR sağlama sözleşmesi.[3] OEM sözleşmesi dünyanın en büyük faks makinesi, lazer yazıcı, tarayıcı ve diğer ofis ekipmanı üreticisi olan Brother Corporation ile imzalandı. Anlaşmaya göre, yeni silindir tarayıcı Brother IC-150, dünya çapında tarama ve tanıma için Bilişsel yazılımla donatıldı.

1996 - Dünyanın en büyük monitör, faks makinesi, lazer yazıcı, MFP ve diğer ofis ekipmanı üreticilerinden biri olan Samsung Information Systems America ile OEM anlaşması. Anlaşmaya göre, yeni çok işlevli cihaz Samsung OFFICE MASTER OML-8630A, dünya çapında Bilişsel Cuneiform LE sembol optik tanıma sistemi ile donatılacaktı.

  • Çok işlevli cihazlar Xerox 3006 ve Pro-610'u CuneiForm tanıma sistemi ile donatmak için önde gelen bir ofis ekipmanı üreticisi Xerox ile OEM anlaşması.
  • Dünyanın ilk uyarlanabilir tanıma algoritmaları ile CuneiForm '96 OCR sürümü.

Uyarlanabilir Tanıma - iki tür basılı karakter tanıma algoritmasının birleşimine dayalı bir yöntem: çoklu bağlantı ve omnifont. Sistem, belirli giriş sembollerine dinamik bir ayarlama (uyarlama) kullanarak iyi yazdırılmış karakterlere dayalı olarak her girdi belgesi için bir dahili yazı tipi üretir. Bu nedenle yöntem, omnifont yaklaşımının çok yönlülüğünü ve teknolojik verimliliğini, tanıma oranını önemli ölçüde artıran yüksek yazı tipi tanıma doğruluğu ile birleştirir.

1997 - CuneiForm'da sinir ağı tabanlı teknolojilerin ilk kullanımı. Karakter tanıma için sinir ağlarını kullanan algoritmalar şu şekilde geliştirilir: tanınacak karakter görüntüsü (desen) belirli bir standart boyuta (normalize) indirgenir. Normalleştirilmiş modelin parlaklık değerleri, sinir ağı için girdi parametreleri olarak kullanılır. Sinir ağının çıktı parametrelerinin sayısı, tanınan karakterlerin sayısına eşittir. Tanıma sonucu, sinir ağının çıkış vektörünün maksimum değerine karşılık gelen bir semboldür.

  • Canon ile Rusya'ya ithal edilen çok işlevli cihazları CuneiForm sistemiyle donatan yeni OEM anlaşması;
  • OKI Europe Limited ile Rusya'ya CuneiForm sistemiyle ithal edilen MFP'lerin OKI FAX 4100 ve OKI FAX 5200 MFD'lerin donatılmasına ilişkin yeni OEM sözleşmesi;
  • Intel MMX işlemci sürümü için ilk CuneiForm MMX Güncelleme OCR sistemi;
  • NeuHause tarayıcıları CuneiForm tanıma sistemiyle birlikte gelir;
  • Rusya'nın ilk ağ tarama sistemi CuneiForm 98 NEST sürümü.

1999

  • Rusya'ya ithal edilen çok işlevli cihazların CuneiForm sistemi ile tedarikine ilişkin Olivetti şirketi ile yeni OEM sözleşmesi;
  • OCR Cuneiform Direct'in Avrupa'da dağıtımı konusunda WSKA (Fransa) yazılım şirketinin önde gelen bir Avrupalı ​​distribütörüyle dağıtım anlaşması;
  • "Bilişsel analiz TM" yöntemini uygulayan sistemin yeni sürümü Cuneiform 2000: tanıma çekirdeğine entegre edilmiş, her bir algılama algoritmasından gelen çıktıdaki tahminlere alternatifleri analiz eden ve en iyisini seçen bir uzman sistem seçeneği.
  • Yöntemi "Meridyen tablosu segmentasyonu TM" çıktı belgesindeki tablonun orijinal biçimini yeniden oluşturma doğruluğunun iyileştirilmesi için geliştirilmiştir;
  • Orijinal belge biçimi yeniden oluşturma mekanizması - "Taradığınız şey, TM aldığınız şeydir" tanıtıldı. Teknoloji, taranan belgenin orijinal formunu bileşenlerinin yerleşimi açısından kaydetmeyi amaçlıyordu. Bu, özellikle karmaşık topolojiye sahip belgeler için önemlidir: başlıklar, açıklamalar, grafik resimler, tablolar vb. İçeren çok sütunlu metinler.

2001 - Canon ile tarayıcıları ve çok işlevli cihaz ekipmanı için Bilişsel Teknolojiler ile OEM sözleşmesi Doğu Avrupa için CuneiForm OCR yazılımı

Gelişim umutları

  • 12 Aralık 2007 OCR CuneiForm ücretsiz yazılım -sürüm yayınlandı ve kaynağının açılışı duyuruldu.
  • 2 Nisan 2008, Çivi Yazılı OCR'nin kaynak kodları, BSD lisansı ve sonbaharda - sistemin arayüz kaynak metinleri.
  • Windows için OpenSource sürümünün en son sürümü 14.02.2009 tarihinden beri güncellenmemiştir. Bu sürüm artık indirilemiyor. Bunun yerine, 11.11.2008 sürümü indirme sayfasında mevcuttur
  • 2009'da Cuneiform'ın açık versiyonu için grafik arayüzler Qt 4 kütüphane - Çivi yazısı-Qt,[4] YAGF yayınlandı. 0.9.0 sürümünden itibaren[5] Linux için açık sürüm şu şekilde kullanılabilir: kütüphane.

Ayrıca bakınız

  • Puma.NET Bilişsel Teknolojiler CuneiForm tanıma motoru için bir sarmalayıcı kitaplığıdır. OCR işlevselliğini herhangi bir .NET Framework 2.0 (veya üzeri) uygulamasına dahil etmeyi kolaylaştırır.

Referanslar

Dış bağlantılar