Pachinko tahsisi - Pachinko allocation - Wikipedia

İçinde makine öğrenme ve doğal dil işleme, pachinko tahsis modeli (PAM) bir konu modeli. Konu modelleri, bir belge koleksiyonunun gizli tematik yapısını ortaya çıkarmak için kullanılan bir algoritma paketidir. [1] Algoritma, aşağıdaki gibi önceki konu modellerini geliştirir: gizli Dirichlet tahsisi (LDA) konuları oluşturan kelime korelasyonlarına ek olarak konular arasındaki korelasyonları modelleyerek. PAM, gizli Dirichlet tahsisinden daha fazla esneklik ve daha fazla ifade gücü sağlar.[2] İlk olarak doğal dil işleme bağlamında tanımlanmış ve uygulanmış olsa da, algoritma aşağıdaki gibi diğer alanlarda uygulamalara sahip olabilir: biyoinformatik. Modelin adı Pachinko makineler - Japonya'da popüler olan, metal topların karmaşık iğnelerden oluşan bir koleksiyonun alt tarafındaki çeşitli kutulara inene kadar sekerek aşağıya sarktığı bir oyun.[3]

Tarih

Pachinko tahsisi ilk olarak Wei Li tarafından tanımlandı ve Andrew McCallum 2006 yılında.[3]Fikir, 2007'de Li, McCallum ve David Mimno tarafından hiyerarşik Pachinko tahsisi ile genişletildi.[4] 2007'de McCallum ve meslektaşları, hiyerarşik Dirichlet sürecinin (HDP) bir varyantına dayanan PAM için parametrik olmayan bir Bayesçi öneri önerdiler.[2] Algoritma, MALLET McCallum'un grubu tarafından yayınlanan yazılım paketi Massachusetts Amherst Üniversitesi.

Modeli

PAM, V'deki kelimeleri ve T'deki konuları rastgele bir şekilde birleştirir Yönlendirilmiş döngüsüz grafiği (DAG), konu düğümlerinin iç seviyeleri işgal ettiği ve yaprakların kelimeler olduğu.

Bütün bir külliyat oluşturma olasılığı, her belge için olasılıkların ürünüdür:

Ayrıca bakınız

Referanslar

  1. ^ Blei, David. "Konu modelleme". Arşivlenen orijinal 2 Ekim 2012'de. Alındı 4 Ekim 2012.
  2. ^ a b Li, Wei; Blei, David; McCallum, Andrew (2007). "Parametrik Olmayan Bayes Pachinko Tahsisi". arXiv:1206.5270. Alıntı dergisi gerektirir | günlük = (Yardım)
  3. ^ a b Li, Wei; McCallum, Andrew (2006). "Pachinko Tahsisi: Konu İlişkilerinin DAG-Yapılandırılmış Karışım Modelleri" (PDF). 23. Uluslararası Makine Öğrenimi Konferansı Bildirileri.
  4. ^ Mimno, David; Li, Wei; McCallum, Andrew (2007). "Pachinko Tahsisi ile Hiyerarşik Konuların Karışımları" (PDF). 24. Uluslararası Makine Öğrenimi Konferansı Bildirileri.
  5. ^ Hofmann, Thomas (1999). "Olasılıksal Gizli Anlamsal Endeksleme" (PDF). Yirmi İkinci Yıllık Uluslararası SİGİR Bilgi Erişiminde Araştırma ve Geliştirme Konferansı Bildirileri. Arşivlenen orijinal (PDF) 14 Aralık 2010.
  6. ^ Blei, David M .; Ng, Andrew Y .; Ürdün, Michael I; Lafferty, John (Ocak 2003). "Gizli Dirichlet tahsisi". Makine Öğrenimi Araştırmaları Dergisi. 3: pp. 993–1022. Arşivlenen orijinal 1 Mayıs 2012'de. Alındı 19 Temmuz 2010.

Dış bağlantılar