Pachinko tahsisi - Pachinko allocation - Wikipedia

İçinde makine öğrenme ve doğal dil işleme, pachinko tahsis modeli (PAM) bir konu modeli. Konu modelleri, bir belge koleksiyonunun gizli tematik yapısını ortaya çıkarmak için kullanılan bir algoritma paketidir. ^[1] Algoritma, aşağıdaki gibi önceki konu modellerini geliştirir: gizli Dirichlet tahsisi (LDA) konuları oluşturan kelime korelasyonlarına ek olarak konular arasındaki korelasyonları modelleyerek. PAM, gizli Dirichlet tahsisinden daha fazla esneklik ve daha fazla ifade gücü sağlar.^[2] İlk olarak doğal dil işleme bağlamında tanımlanmış ve uygulanmış olsa da, algoritma aşağıdaki gibi diğer alanlarda uygulamalara sahip olabilir: biyoinformatik. Modelin adı Pachinko makineler - Japonya'da popüler olan, metal topların karmaşık iğnelerden oluşan bir koleksiyonun alt tarafındaki çeşitli kutulara inene kadar sekerek aşağıya sarktığı bir oyun.^[3]

Tarih

Pachinko tahsisi ilk olarak Wei Li tarafından tanımlandı ve Andrew McCallum 2006 yılında.^[3]Fikir, 2007'de Li, McCallum ve David Mimno tarafından hiyerarşik Pachinko tahsisi ile genişletildi.^[4] 2007'de McCallum ve meslektaşları, hiyerarşik Dirichlet sürecinin (HDP) bir varyantına dayanan PAM için parametrik olmayan bir Bayesçi öneri önerdiler.^[2] Algoritma, MALLET McCallum'un grubu tarafından yayınlanan yazılım paketi Massachusetts Amherst Üniversitesi.

Modeli

PAM, V'deki kelimeleri ve T'deki konuları rastgele bir şekilde birleştirir Yönlendirilmiş döngüsüz grafiği (DAG), konu düğümlerinin iç seviyeleri işgal ettiği ve yaprakların kelimeler olduğu.

Bütün bir külliyat oluşturma olasılığı, her belge için olasılıkların ürünüdür:

${ displaystyle P ( mathbf {D} | alpha) = prod _ {d} P (d | alpha)}$

Ayrıca bakınız

Olasılıksal gizli anlamsal indeksleme (PLSI), 1999'da Thomas Hofmann'dan erken bir konu modeli.^[5]
Gizli Dirichlet tahsisi tarafından geliştirilen bir PLSI genellemesi David Blei, Andrew Ng, ve Michael Jordan 2002'de belgelerin konuların bir karışımına sahip olmasına izin verildi.^[6]
MALLET, Pachinko tahsisini uygulayan açık kaynaklı bir Java kitaplığı.

Referanslar

^ Blei, David. "Konu modelleme". Arşivlenen orijinal 2 Ekim 2012'de. Alındı 4 Ekim 2012.
^ ^a ^b Li, Wei; Blei, David; McCallum, Andrew (2007). "Parametrik Olmayan Bayes Pachinko Tahsisi". arXiv:1206.5270. Alıntı dergisi gerektirir | günlük = (Yardım)
^ ^a ^b Li, Wei; McCallum, Andrew (2006). "Pachinko Tahsisi: Konu İlişkilerinin DAG-Yapılandırılmış Karışım Modelleri" (PDF). 23. Uluslararası Makine Öğrenimi Konferansı Bildirileri.
^ Mimno, David; Li, Wei; McCallum, Andrew (2007). "Pachinko Tahsisi ile Hiyerarşik Konuların Karışımları" (PDF). 24. Uluslararası Makine Öğrenimi Konferansı Bildirileri.
^ Hofmann, Thomas (1999). "Olasılıksal Gizli Anlamsal Endeksleme" (PDF). Yirmi İkinci Yıllık Uluslararası SİGİR Bilgi Erişiminde Araştırma ve Geliştirme Konferansı Bildirileri. Arşivlenen orijinal (PDF) 14 Aralık 2010.
^ Blei, David M .; Ng, Andrew Y .; Ürdün, Michael I; Lafferty, John (Ocak 2003). "Gizli Dirichlet tahsisi". Makine Öğrenimi Araştırmaları Dergisi. 3: pp. 993–1022. Arşivlenen orijinal 1 Mayıs 2012'de. Alındı 19 Temmuz 2010.

Dış bağlantılar

Hiyerarşik Konuların Pachinko Tahsisi ile Karışımları, 2007'de HPAM'ı sunan David Mimno'nun video kaydı.

Bu bilgisayar Bilimi makale bir Taslak. Wikipedia'ya şu yollarla yardımcı olabilirsiniz: genişletmek.

[1] Blei, David. "Konu modelleme". Arşivlenen orijinal 2 Ekim 2012'de. Alındı 4 Ekim 2012.

[mccallum07-2] Li, Wei; Blei, David; McCallum, Andrew (2007). "Parametrik Olmayan Bayes Pachinko Tahsisi". arXiv:1206.5270. Alıntı dergisi gerektirir | günlük = (Yardım)

[li2006-3] Li, Wei; McCallum, Andrew (2006). "Pachinko Tahsisi: Konu İlişkilerinin DAG-Yapılandırılmış Karışım Modelleri" (PDF). 23. Uluslararası Makine Öğrenimi Konferansı Bildirileri.

[mimno2007-4] Mimno, David; Li, Wei; McCallum, Andrew (2007). "Pachinko Tahsisi ile Hiyerarşik Konuların Karışımları" (PDF). 24. Uluslararası Makine Öğrenimi Konferansı Bildirileri.

[hofmann1999-5] Hofmann, Thomas (1999). "Olasılıksal Gizli Anlamsal Endeksleme" (PDF). Yirmi İkinci Yıllık Uluslararası SİGİR Bilgi Erişiminde Araştırma ve Geliştirme Konferansı Bildirileri. Arşivlenen orijinal (PDF) 14 Aralık 2010.

[blei2003-6] Blei, David M .; Ng, Andrew Y .; Ürdün, Michael I; Lafferty, John (Ocak 2003). "Gizli Dirichlet tahsisi". Makine Öğrenimi Araştırmaları Dergisi. 3: pp. 993–1022. Arşivlenen orijinal 1 Mayıs 2012'de. Alındı 19 Temmuz 2010.

[1]

[2]

[3]

[4]

[5]

[6]

Doğal dil işleme
Genel terimler	AI tamamlandı Kelime torbası n-gram Bigram Trigram Doğal dil anlayışı Konuşma korpusu Engellenecek Kelimeler Metin külliyatı
Metin analizi	Sıralama çıkarma Konsept madenciliği Bileşik terim işleme Çekirdek referans çözünürlüğü Lemmatizasyon Adlandırılmış varlık tanıma Ontoloji öğrenimi Ayrıştırma Konuşma bölümü etiketleme Anlamsal benzerlik Duygu analizi Stemming Terminoloji çıkarma Metin yığınlama Metin bölümleme Cümle bölütleme Kelime segmentasyonu Metinsel girişim Truecasing Kelime anlamında belirsizlik giderme
Otomatik özetleme	Çok belgeli özetleme Cümle çıkarma Metin basitleştirme
Makine çevirisi	Bilgisayar destekli Örneğe dayalı Kural tabanlı Sinirsel
Otomatik tanımlama ve veri yakalama	Konuşma tanıma Konuşma segmentasyonu Konuşma sentezi Doğal dil üretimi Optik karakter tanıma
Konu modeli	Gizli Dirichlet tahsisi Gizli anlamsal analiz Pachinko tahsisi
Bilgisayar destekli inceleme	Otomatik makale puanlama Concordancer Dilbilgisi denetleyicisi Yazım tahmini Yazım denetleyicisi Sözdizimi tahmini
Doğal lisan Kullanıcı arayüzü	Sohbet robotu Etkileşimli kurgu Soru cevaplama Sanal asistan Sesli kullanıcı arayüzü