Örnek tabanlı makine çevirisi - Example-based machine translation

Örnek tabanlı makine çevirisi (EBMT) bir yöntemdir makine çevirisi genellikle iki dilli kullanımı ile karakterize edilir külliyat ile paralel metinler çalışma zamanında ana bilgi tabanı olarak. Esasen bir çeviridir benzetme ve bir uygulaması olarak görülebilir vaka temelli muhakeme yaklaşım makine öğrenme.

Analoji ile çeviri

Örnek tabanlı makine çevirisinin temelinde, benzetme yoluyla çeviri fikri yatar. İnsan çevirisi sürecine uygulandığında, çevirinin analoji yoluyla gerçekleştiği fikri, insanların derin dilbilimsel analizler yaparak cümleleri tercüme ettiği fikrinin reddedilmesidir. Bunun yerine, insanların önce bir cümleyi belirli cümlelere ayırarak, sonra bu cümleleri tercüme ederek ve son olarak bu parçaları tek bir uzun cümleye uygun şekilde oluşturarak tercüme ettikleri inancı üzerine kuruludur. Deyimsel çeviriler önceki çevirilere benzetilerek çevrilir. Benzetmeyle çeviri ilkesi, böyle bir sistemi eğitmek için kullanılan örnek çeviriler aracılığıyla örnek tabanlı makine çevirisine kodlanmıştır.

Makine çevirisine yönelik diğer yaklaşımlar: istatistiksel makine çevirisi ayrıca çeviri sürecini öğrenmek için iki dilli corpora kullanın.

Tarih

Örnek tabanlı makine çevirisi ilk olarak Makoto Nagao 1984'te.[1] Özellikle İngilizce ve Japonca gibi tamamen farklı iki dil arasında çeviriye uyarlandığına dikkat çekti. Bu durumda, bir cümle başka bir dilde birkaç iyi yapılandırılmış cümleye çevrilebilir, bu nedenle, derin dilbilimsel analiz özelliğini yapmanın faydası yoktur. kural tabanlı makine çevirisi.

Misal

İki dilli korpus örneği
ingilizceJaponca
O ne kadar kırmızı şemsiye?Ano akai kasa wa ikura desu ka.
O ne kadar küçük kamera?Ano chiisai kamera wa ikura desu ka.

Örnek tabanlı makine çevirisi sistemleri, yukarıdaki tabloda gösterilen örnek gibi cümle çiftleri içeren iki dilli paralel korporadan eğitilir. Cümle çiftleri, bir dildeki cümleleri ve diğerine çevirilerini içerir. Belirli bir örnek, bir minimal çiftyani cümlelerin yalnızca bir öğeye göre değiştiği anlamına gelir. Bu cümleler, bir cümlenin bölümlerinin çevirilerini öğrenmeyi kolaylaştırır. Örneğin, örnek tabanlı bir makine çevirisi sistemi yukarıdaki örnekten üç birim çeviri öğrenecektir:

  1. O ne kadar X ? karşılık gelir Ano X wa ikura desu ka.
  2. kırmızı şemsiye karşılık gelir akai kasa
  3. küçük kamera karşılık gelir chiisai kamera

Bu birimleri oluşturmak, gelecekte yeni çeviriler üretmek için kullanılabilir. Örneğin, cümleleri içeren bir metin kullanarak eğitildiysek:

Başkan Kennedy, geçit töreni sırasında vurularak öldürüldü. ve Hükümlü 15 Temmuz'da kaçtı. Cümleyi tercüme edebiliriz Hükümlü, geçit töreni sırasında vurularak öldürüldü. cümlelerin uygun kısımlarını değiştirerek.

Deyimsel fiiller

Örnek tabanlı makine çevirisi, aşağıdaki gibi alt dil olayları için en uygunudur: öbek fiiller. Öbek fiillerin bağlama bağlı anlamları vardır. İngilizcede yaygındır ve burada bir fiil ve ardından bir zarf ve / veya a edat, bunlara parçacık fiile. Öbek fiiller, bileşenlerin anlamından türetilemeyen özel bağlama özgü anlamlar üretir. Kaynaktan hedef dile kelimeden kelimeye çeviri sırasında neredeyse her zaman bir belirsizlik vardır.

Örnek olarak, "koymak" deyimini ve onun Hindustani tercüme. Aşağıdaki yollardan herhangi biriyle kullanılabilir:

  • Ram ışıkları yaktı. (Açık) (Hindustani çevirisi: Jalana)
  • Ram bir şapka taktı. (Wear) (Hindustani çevirisi: Pahenna)

Ayrıca bakınız

Referanslar

  1. ^ Makoto Nagao (1984). "Benzetme ilkesiyle Japonca ve İngilizce arasında mekanik bir çeviri çerçevesi" (PDF). A. Elithorn ve R. Banerji (ed.). Yapay ve İnsan Zekası. Elsevier Science Publishers.

daha fazla okuma

Dış bağlantılar

  • Cunei - EBMT'deki araştırmalardan doğan, veri odaklı makine çevirisi için açık kaynaklı bir platform, ancak aynı zamanda SMT alan