Cümle yerleştirme - Sentence embedding

Cümle yerleştirme bir dizi tekniğin ortak adıdır doğal dil işleme (NLP) cümlelerin eşlendiği yer vektörler nın-nin gerçek sayılar[1][2][3][4][5][6][7][8].

Uygulama

Cümle yerleştirme, derin öğrenme yazılım kitaplıkları PyTorch[9] ve TensorFlow[10]

Değerlendirme

Cümle kodlamalarını test etmenin bir yolu, bunları Bileşimsel Bilgiyi İçeren Cümleler (SICK) külliyatına uygulamaktır.[11]hem rahatsızlık (SICK-E) hem de ilişki (SICK-R) için.

İçinde [12] en iyi sonuçlar a kullanılarak elde edilir BiLSTM ağı üzerinde eğitilmiş Stanford Natural Language Inference (SNLI) Corpus. Pearson korelasyon katsayısı SICK-R için 0.885 ve SICK-E için sonuç 86.3'tür. Önceki puanlara göre küçük bir gelişme şu sayfada sunulmuştur: [13]: SICK-R: 0.888 ve SICK-E: 87.8 çift yönlü bir birleşim kullanarak Geçitli tekrarlayan birim.

Ayrıca bakınız

Dış bağlantılar

InferSent cümle yerleştirmeleri ve eğitim kodu

Genel Amaçlı Dağıtılmış Cümle Temsillerini Büyük Ölçekli Çok Görevli Öğrenme Yoluyla Öğrenme

Referanslar

  1. ^ Kağıt Özeti: Aşağı akışta ve dilbilimsel araştırma görevlerinde cümle yerleştirmelerinin değerlendirilmesi
  2. ^ Oren Barkan, Noam Razin, Itzik Malkiel, Ori Katz, Avi Caciularu, Noam Koenigstein. "Distile Cümle Gömme Yoluyla Ölçeklenebilir Özenli Cümle-Çift Modeli" AAAI 2020; arxiv: 1908.05161.
  3. ^ Evrensel Kelime Gömme ve Cümle Gömmelerinin Güncel En İyileri
  4. ^ Daniel Cer, Yinfei Yang, Sheng-yi Kong, Nan Hua, Nicole Limtiaco, Rhomni St. John, Noah Constant, Mario Guajardo-Cespedes, Steve Yuan, Chris Tar, Yun-Hsuan Sung, Brian Strope: "Evrensel Cümle Kodlayıcı", 2018; arXiv: 1803.11175.
  5. ^ Ledell Wu, Adam Fisch, Sumit Chopra, Keith Adams, Antoine Bordes: “StarSpace: Her Şeyi Yerleştirin!”, 2017; arXiv: 1709.03856.
  6. ^ Sanjeev Arora, Yingyu Liang ve Tengyu Ma. "Cümle düğünleri için basit ama yenmesi zor bir temel.", 2016; openreview: SyK00v5xx.
  7. ^ Mircea Trifan, Bogdan Ionescu, Cristian Gadea ve Dan Ionescu. "Anlamsal analiz için bir grafik dijital sinyal işleme yöntemi." Applied Computational Intelligence and Informatics (SACI), 2015 IEEE 10th Jubilee International Symposium on, pp. 187-192. IEEE, 2015; ieee: 7208196.
  8. ^ Pierpaolo Basile, Annalina Caputo ve Giovanni Semeraro. "Dağıtım uzaylarında kelimelerin bileşimsel anlambilimiyle ilgili bir çalışma." Anlamsal Hesaplamada (ICSC), 2012 IEEE Altıncı Uluslararası Konferansı, s. 154-161. IEEE, 2012; ieee: 6337099 .
  9. ^ Microsoft. "damıtılmış cümle yerleştirme".
  10. ^ Google. "evrensel cümle kodlayıcı". TensorFlow Hub. Alındı 6 Ekim 2018.
  11. ^ Marco Marelli, Stefano Menini, Marco Baroni, Luisa Bentivogli, Raffaella Bernardi ve Roberto Zamparelli. "Bileşimsel dağılımsal anlamsal modellerin değerlendirilmesi için SICK tedavisi." LREC, s. 216-223. 2014 [1].
  12. ^ Alexis Conneau, Douwe Kiela, Holger Schwenk, Loic Barrault: "Evrensel Cümle Temsillerinin Doğal Dil Çıkarım Verilerinden Denetimli Öğrenimi", 2017; arXiv: 1705.02364.
  13. ^ Sandeep Subramanian, Adam Trischler, Yoshua Bengio: "Genel Amaçlı Dağıtılmış Cümle Temsillerini Büyük Ölçekli Çok Görevli Öğrenme Yoluyla Öğrenme", 2018; arXiv: 1804.00079.