Sıralama çıkarma - Collocation extraction

Sıralama çıkarma ayıklamak için bir bilgisayar kullanma görevidir eşdizimler otomatik olarak külliyat.

Eşdizim özütlemesini gerçekleştirmenin geleneksel yöntemi, her sözcük çiftiyle ilişkili bir puanı hesaplamak için bu sözcüklerin istatistiksel miktarlarına dayalı bir formül bulmaktır. Önerilen formüller karşılıklı bilgi, t testi, z testi, ki-kare testi ve olasılık oranı.[1]

Alanı içinde külliyat dilbilim, sıralama kelime dizisi olarak tanımlanır veya şartlar hangi birlikte meydana gelmek şans eseri beklenenden daha sık. 'Kristal netliğinde', 'orta düzey yönetim', 'çekirdek aile' ve 'kozmetik cerrahi', yan yana yerleştirilmiş kelime çiftlerine örnektir. Bazı kelimeler genellikle bir arada bulunur çünkü Bileşik isim, örneğin 'bot sürme' veya 'motorlu bisikletçi'

Ayrıca bakınız

Dış bağlantılar

Referanslar

  1. ^ Manning, C. D .; Schütze, H. (1999). İstatistiksel doğal dil işlemenin temelleri. Cambridge, MA: MIT Press. ISBN  978-0-262-13360-9.