Sayres paradoksu - Sayres paradox - Wikipedia

Sayre'nin Paradoksu otomatik tasarımda karşılaşılan bir ikilemdir elyazısı tanıma sistemleri. Paradoksun standart bir ifadesi, el yazısıyla yazılmış bir kelimenin, bölümlenmiş ve tanınmadan bölümlere ayrılamaz.[1] Paradoks ilk olarak 1973 tarihli bir yayında dile getirildi. Kenneth M. Sayre, kimden sonra seçildi.[2]

Sorunun doğası

Basılı bir formatta yazılı sözcükleri tanıyabilen otomatik sistemler tasarlamak nispeten kolaydır. Bu tür kelimeler, onları sayfaya yazarak harflere bölünür. Belirli bir dildeki tipik harf şekilleriyle eşleşen şablonlar göz önüne alındığında, tek tek harfler yüksek bir olasılıkla tanımlanabilir. Belirsizlik durumlarında, olası harf dizileri, o dilde uygun şekilde yazılmış kelimelerin bir seçimiyle karşılaştırılabilir (sözlük olarak adlandırılır).[3] Gerekirse, söz konusu kelimelerin genel olarak doğru bir şekilde tanımlanmasını sağlamak için dilin sözdizimsel özellikleri uygulanabilir.[4] Bu türden basılı karakter tanıma sistemleri, standartlaştırılmış hükümet formlarının işlenmesinde, postaların posta koduna göre sıralanmasında vb. Yaygın olarak kullanılır.

Bununla birlikte, el yazısı yazımında, belirli bir kelimeyi içeren harfler tipik olarak aralarında boşluk olmadan sırayla akar. Bir dizi basılı harfin aksine, el yazısı ile bağlanmış harfler önceden bölümlere ayrılmamıştır. İşte Sayre'nin Paradoksu devreye giriyor. Kelime zaten harflere bölünmediği sürece, yukarıda açıklananlar gibi şablon eşleştirme teknikleri uygulanamaz. Yani bölümleme, kelime tanıma için bir ön şarttır. Ancak, kelimenin kendisi tanımlanmadıkça bir kelimeyi harflere ayırmanın güvenilir bir tekniği yoktur. Kelime tanıma, harf segmentasyonu gerektirir ve harf segmentasyonu kelime tanıma gerektirir. Standart şablon eşleştirme tekniklerini kullanan bir el yazısı tanıma sisteminin her ikisini aynı anda yapabilmesi mümkün değildir.

Otomatikleştirilmiş el yazısı tanıma sistemlerinin kullanımıyla elde edilecek avantajlar, postayı el yazısı adreslerle yönlendirme, el yazısı banka çeklerini okuma ve elle yazılmış belgelerin otomatik dijitalleştirilmesini içerir.[5] Bunlar, Sayre'nin Paradoksunu aşmanın yollarını bulmaya yönelik pratik teşviklerdir.

Paradokstan kaçınmak

Paradoksun olumsuz etkilerini iyileştirmenin bir yolu, tanınacak sözcük yazıtlarını normalleştirmektir. Normalleştirme, harflerin alışılmadık eğimi ve el yazısı satırının alışılmadık eğimi gibi yazarın yazdığı özdeyişlerin ortadan kaldırılması anlamına gelir.[6] Bu prosedür, bir harf şablonu ile doğru bir eşleşme olasılığını artırarak sistemin başarı oranında kademeli bir iyileşme sağlayabilir. Bu türdeki iyileştirme hala doğru segmentasyona bağlı olduğundan, Sayre'nin Paradoksunun sınırlamalarına tabi olmaya devam etmektedir.[7] Araştırmacılar, paradoksu aşmanın tek yolunun doğru segmentasyona dayanmayan prosedürler kullanmak olduğunu fark ettiler.[8]

Mevcut araştırmanın yönleri

Bölümleme, tanıma için sisteme sunulan gerçek yazıtlardaki harfler arasındaki farklılıklarla eşleştiği ölçüde doğrudur (giriş verileri). Bu bazen "açık bölümleme" olarak adlandırılır.[9] "Örtülü bölümleme", aksine, el yazısı satırının el yazısı satırının kendisindeki gerçek harf sayısından daha fazla parçaya bölünmesidir. Nihai kelime tanımlamasına ulaşmak için bu "örtük kısımların" işlenmesi, aşağıdakileri içeren özel istatistiksel prosedürler gerektirir: Gizli Markov Modelleri (HMM).

Bir Markov modeli rastgele bir sürecin istatistiksel bir temsilidir, yani gelecekteki durumların şimdiden önce meydana gelen durumlardan bağımsız olduğu bir süreçtir. Böyle bir süreçte, belirli bir durum, yalnızca kendisinden hemen önceki durumu takip etme koşullu olasılığına bağlıdır. Bir örnek, bir kalıbın arka arkaya atılmasından elde edilen bir dizi sonuçtur. HMM, tek tek durumları tam olarak bilinmeyen bir Markov modelidir. Durumlar arasındaki koşullu olasılıklar hala belirleyicidir, ancak ayrı ayrı durumların kimlikleri tam olarak açıklanmamaktadır.

Tanıma, tanınacak kelimelerin HMM'lerini sözlükteki önceden hazırlanmış kelimelerin HMM'leriyle eşleştirerek ilerler. Belirli bir durumda en iyi eşleşme, söz konusu el yazısıyla yazılmış kelimenin kimliğini belirtmek için alınır. Açık bölümlemeye dayalı sistemlerde olduğu gibi, örtük bölümlemeye dayalı otomatik tanıma sistemleri, gerçekleştirdikleri doğru tanımlamaların yüzdesine göre az ya da çok başarılı olarak değerlendirilir.

Açık bölümleme teknikleri yerine, çoğu otomatik el yazısı tanıma sistemi bugün HMM tabanlı eşleştirme prosedürleri ile birlikte örtük bölümleme kullanır.[10] Sayre'nin Paradoksu tarafından özetlenen kısıtlamalar, yaklaşımdaki bu değişimden büyük ölçüde sorumludur.

Referanslar

  1. ^ Alessandro Vinciarelli'nin "Çevrimdışı El Yazısı: Sözcükten Metin Tanıma" adlı doktora tezine bakın (http://infoscience.epfl.ch/record/82879 ). Ayrıca bkz.Makine Öğrenimi: Teori ve Uygulamalar, Cilt. Handbook of Statistics, B. V. Elsevier, ed., S. 422 (https://one.overdrive.com/media/1358341/machine-learning-theory-and-applications ).
  2. ^ Kenneth M. Sayre, "El Yazısıyla Yazılmış Kelimelerin Makineyle Tanınması: Bir Proje Raporu," Örüntü Tanıma, Pergamon Press, Cilt. 5, 1973, s. 213-228.
  3. ^ Alessandro Vinciarelli, "Çevrimdışı El Yazılı Kelime Tanıma Üzerine Bir Anket," Örüntü Tanıma, Cilt. 35, sayı 7. Temmuz 2002, s. 1433-1446.
  4. ^ André O. Maroneze, Bertrant Coüashon ve Aurélie Lemaitre tarafından yazılan "Belge Görüntü Tanıma için Sözdizimsel bir analizörde İstatistiksel Bilgilerin Girişine" bakın (http://proceedings.spiedigitallibrary.org/proceeding.aspx?articleid=731511 ).
  5. ^ Bkz. Alessandro Vinciarelli, "Offline Cursive Handwriting: From Word to Text Recognition", op. cit.
  6. ^ Alessandro Vinciarelli, "Çevrimdışı Cursive Kelime Tanıma Üzerine Bir Anket," op. cit.
  7. ^ Alessandro Vinciarelli, "Çevrimdışı El Yazısı: Sözcükten Metin Tanıma", op. cit.
  8. ^ Alessandro Vinciarelli, "Çevrimdışı El Yazısı: Sözcükten Metin Tanıma", op. cit.
  9. ^ Alessandro Vinciarelli, "Çevrimdışı Cursive Kelime Tanıma Üzerine Bir Anket," op. cit.
  10. ^ Alessandro Vinciarelli, "Çevrimdışı El Yazısı: Sözcükten Metin Tanıma", op. cit.

Dış bağlantılar