LEPOR - LEPOR

LEPOR otomatik bir dilden bağımsızdır makine çevirisi değerlendirmesi ayarlanabilir parametreler ve güçlendirilmiş faktörlerle metrik.

Arka fon

Dan beri IBM sistemini önerdi ve gerçekleştirdi BLEU [1] otomatik metrik olarak Makine Çevirisi (MT) değerlendirmesi, onu revize etmek veya iyileştirmek için TER gibi başka birçok yöntem önerilmiştir, METEOR,[2] vb. Ancak, gelenekselde bazı sorunlar vardır. otomatik değerlendirme ölçütleri. Bazı ölçütler belirli dillerde iyi performans gösterirken diğer dillerde zayıftır ve bu genellikle dil önyargısı sorunu olarak adlandırılır. Bazı ölçütler birçok dil özelliğine veya dil bilgisine dayanır, bu da diğer araştırmacıların deneyleri tekrar etmesini zorlaştırır. LEPOR, mevcut sorunlardan bazılarını ele almaya çalışan otomatik bir değerlendirme metriğidir.[3] LEPOR, dil önyargı sorununu ele almak için artırılmış faktörlerle ve ilgili ayarlanabilir parametrelerle tasarlanmıştır. Ayrıca, LEPOR'un geliştirilmiş versiyonunda, yani hLEPOR'da,[4] elde edilen optimize edilmiş dil özelliklerini kullanmaya çalışır. Treebanks. LEPOR'un bir başka gelişmiş versiyonu nLEPOR metriğidir,[5] bu, n-gram özelliklerini önceki faktörlere ekler. Şimdiye kadar, LEPOR metriği LEPOR serisi olarak geliştirildi.[6]

Tasarım

LEPOR, geliştirilmiş uzunluk cezası faktörleri ile tasarlanmıştır, hassas, n-gram kelime sırası cezası ve hatırlama. Arttırılmış uzunluk cezası, genellikle makine çeviri sistemleri tarafından çevrilen hipotez çevirisinin, referans çeviriden daha uzun veya daha kısa olması halinde cezalandırılmasını sağlar. Kesinlik puanı, hipotez çevirisinin doğruluğunu yansıtır. Geri çağırma puanı, hipotez çevirisinin referans çeviriye veya kaynak dile olan bağlılığını yansıtır. N-gram tabanlı kelime sırası ceza faktörü, hipotez çevirisi ve referans çevirisi arasındaki farklı pozisyon sıraları için tasarlanmıştır. Kelime sırası ceza faktörünün, Wong ve Kit'in (2008) çalışması gibi birçok araştırmacı tarafından yararlı olduğu kanıtlanmıştır.[7]

Verim

LEPOR serileri iyi performanslarını göstermişlerdir. EKL yıllık uluslararası istatistiksel makine çevirisi atölyesi (ACL-WMT ). ACL-WMT, uluslararası bir dernekte makine çevirisi (SIGMT) özel ilgi grubu tarafından düzenlenmektedir: hesaplamalı dilbilimleri (ACL). ACL-WMT 2013'te,[8] İngilizce'den diğerine ve diğerinden İngilizce'ye olmak üzere iki çeviri ve değerlendirme yolu vardır. "Diğer" diller İspanyolca, Fransızca, Almanca, Çekçe ve Rusça'dır. İngilizceden diğerine, nLEPOR metriği, Pearson korelasyon katsayısını kullanarak insan yargılarıyla en yüksek sistem düzeyinde korelasyon puanına ulaşır; Spearman sıra korelasyon katsayısı. Diğerinden İngilizceye doğru, nLEPOR orta düzeyde ve METEOR İnsan yargılarıyla en yüksek korelasyon puanını verir; bunun nedeni, nLEPOR'un resmi olarak sunulan eğitim verileri haricinde yalnızca özlü dil özelliği olan konuşma bölümü bilgisini kullanmasıdır; ancak METEOR, diğer birçok harici kaynağı kullanmıştır. eş anlamlı sözlükler açıklama, ve köklenme, vb.

Saf kelime yüzeyi formu dahil olmak üzere farklı koşullara sahip LEPOR performansları hakkında genişletilmiş bir çalışma ve tanıtım, POS özellikler, ifade etiketleri özellikleri, Macau Üniversitesi'nden bir tezde anlatılmıştır.[9]

WMT13'te hLEPOR ve nLEPOR performansı hakkında derin bir istatistiksel analiz vardır ve bu, "İspanyolca-İngilizce için bireysel dil çifti değerlendirmesinde ve 9 dil çiftinden oluşan toplu kümede" en iyi ölçütlerden biri olarak performans gösterdiğini gösterir, bkz. kağıt (Segment Düzeyinde Makine Çeviri Metriklerinin Doğru Değerlendirilmesi) "https://www.aclweb.org/anthology/N15-1124 "Graham ve diğerleri 2015 NAACL (https://github.com/ygraham/segment-mteval )

Ayrıca bakınız

Notlar

  1. ^ Papineni ve diğerleri, (2002)
  2. ^ Banerjee ve Lavie, (2005)
  3. ^ Han ve diğerleri, (2012)
  4. ^ Han ve diğerleri, (2013a)
  5. ^ Han ve diğerleri, (2013b)
  6. ^ Han ve diğerleri, (2014)
  7. ^ Wong ve Kit, (2008)
  8. ^ ACL-WMT (2013)
  9. ^ Han (2014)

Referanslar

  • Papineni, K., Roukos, S., Ward, T. ve Zhu, W. J. (2002). "BLEU: makine çevirisinin otomatik olarak değerlendirilmesi için bir yöntem" ACL-2002: Hesaplamalı Dilbilim Derneği'nin 40. Yıllık toplantısı s. 311–318
  • Han, A.L.F., Wong, D.F. ve Chao, L.S. (2012) "LEPOR: Artırılmış Faktörlerle Makine Çevirisi için Güçlü Bir Değerlendirme Metriği" 24. Uluslararası Hesaplamalı Dilbilim Konferansı Bildirileri (COLING 2012): Posterler, s. 441–450. Mumbai, Hindistan. Çevrimiçi kağıt Açık kaynak aracı
  • Han, A.L.F., Wong, D.F., Chao, L.S., He, L., Lu, Y., Xing, J., ve Zeng, X. (2013a) "Güçlendirilmiş Faktörlerle Makine Çevirisi Değerlendirmesi için Dilden Bağımsız Model" Makine Çevirisi Zirvesi Bildiriler XIV (MT SUMMIT 2013), s. 215-222. Nice, Fransa. Yayıncı: Uluslararası Makine Çevirisi Derneği. Çevrimiçi kağıt Açık kaynak aracı
  • Han, A.L.F., Wong, D.F., Chao, L.S., Lu, Y., He, L., Wang, Y., and Zhou, J. (2013b) "WMT13 Metrics Task'ta Ayarlanabilir Makine Çeviri Değerlendirme Sistemlerinin Açıklaması" Sekizinci İstatistiksel Makine Çevirisi Çalıştayı Bildirileri, ACL-WMT13, Sofya, Bulgaristan. Hesaplamalı Dilbilim Derneği. Çevrimiçi kağıt s. 414–421
  • Han, A.L.F., Wong, D.F., Chao, L.S., He, L., ve Lu, Y. (2014) "İngilizce'den Almancaya Çeviriye Yönelik Denetimsiz Kalite Tahmin Modeli ve Kapsamlı Denetimli Değerlendirmede Uygulaması" Bilimsel Dünya Dergisi. Konu: Bilgi Teknolojisindeki Son Gelişmeler. ISSN  1537-744X. Hindawi Yayıncılık Şirketi. Çevrimiçi kağıt
  • ACL-WMT. (2013) "ACL-WMT13 METRICS GÖREV "
  • Wong, B.T-M ve Kit, C. (2008). "Otomatik MT değerlendirmesi için kelime seçimi ve kelime konumu" Çalıştay: MetricsMATR of the Association for Machine Translation in the Americas (AMTA), kısa makale, Waikiki, ABD.
  • Banerjee, S. ve Lavie, A. (2005) "METEOR: İnsan Yargılarıyla İyileştirilmiş Korelasyonlu MT Değerlendirmesi için Otomatik Bir Ölçü" Bilgisayarlı Dilbilim Derneği 43. Yıllık Toplantısında MT ve / veya Özetleme için İçsel ve Dışsal Değerlendirme Önlemleri üzerine Çalıştay Bildirileri (ACL-2005), Ann Arbor, Michigan, Haziran 2005
  • Han, Lifeng. (2014) "LEPOR: Artırılmış Makine Çevirisi Değerlendirme Metriği". Yazılım Mühendisliği Yüksek Lisans Tezi. Macau Üniversitesi, Makao. Tez PPT

Dış bağlantılar