Stokastik blok modeli - Stochastic block model

stokastik blok modeli bir üretken model rastgele için grafikler. Bu model, aşağıdakileri içeren grafikler üretme eğilimindedir topluluklar, belirli kenar yoğunlukları ile birbirlerine bağlanmaları ile karakterize edilen alt kümeler. Örneğin, sınırlar topluluklar arasında topluluklar arasında olduğundan daha yaygın olabilir. Stokastik blok modeli, İstatistik, makine öğrenme, ve ağ bilimi, kurtarma görevi için yararlı bir kıyaslama görevi gördüğü topluluk yapısı grafik verilerinde.

Tanım

Stokastik blok modeli aşağıdaki parametreleri alır:

  • Numara köşelerin;
  • köşe kümesinin bir bölümü ayrık alt kümelere , aranan topluluklar;
  • simetrik matris kenar olasılıkları.

Kenar kümesi daha sonra aşağıdaki gibi rastgele örneklenir: herhangi iki köşe ve olasılıkla bir kenara bağlı . Örnek bir problem: kenarların açıklandığı gibi örneklendiği köşeler, grupları kurtarır .

Özel durumlar

Olasılık matrisi bir sabit ise, şu anlamda hepsi için , o zaman sonuç Erdős-Rényi modeli . Bu durum yozlaşmıştır - topluluklara bölünme önemsiz hale gelir - ancak Erdős – Rényi modeliyle yakın bir ilişkiyi göstermektedir.

ekili bölüm modeli olasılık matrisinin değerlerinin özel bir durumdur sabit köşegen ve başka bir sabit köşegen kapalı. Böylece, aynı topluluktaki iki köşe, olasılıkla bir üstünlük paylaşıyor farklı topluluklardaki iki tepe noktası olasılıkla bir üstünlük paylaşırken . Bazen stokastik blok modeli olarak adlandırılan bu sınırlı modeldir. Durum nerede denir çeşitli model, durumda denir üzücü.

Genel stokastik blok modeline dönersek, bir model denir çok iyi Eğer her ne zaman : tüm çapraz girişler tüm çapraz olmayan girişlere hakimdir. Bir model denir zayıf çeşitlilik Eğer her ne zaman : her çapraz giriş sadece kendi satır ve sütununun geri kalanına hakim olmak için gereklidir.[1] Disasortatif bu terminolojinin biçimleri, tüm eşitsizlikleri tersine çevirerek var olur. Algoritmik kurtarma, bu biçimin çeşitli veya dezavantajlı koşullara sahip blok modellerine karşı genellikle daha kolaydır.[1]

Tipik istatistiksel görevler

Algoritmik topluluk algılamasına ilişkin literatürün çoğu, üç istatistiksel görevi ele alır: algılama, kısmi kurtarma ve tam kurtarma.

Tespit etme

Algılama algoritmalarının amacı, örneklenmiş bir grafik verildiğinde, grafiğin gizli topluluk yapısına sahip olup olmadığını belirlemektir. Daha kesin olarak, bilinen bir olasılıksal olasılıkla, bilinen bir stokastik blok modelinden veya benzer bir modelden bir grafik oluşturulabilir. Erdos-Renyi modeli. Algoritmik görev, bu iki temel modelden hangisinin grafiği oluşturduğunu doğru bir şekilde belirlemektir.[2]

Kısmi kurtarma

Kısmi kurtarmada amaç, gerçek bölümle rastgele bir tahminden önemli ölçüde daha iyi ilişkilendirilmiş bir bölüm bulma anlamında topluluklara gizli bölümü yaklaşık olarak belirlemektir.[3]

Tam kurtarma

Tam kurtarmada amaç, gizli bölümü topluluklara tam olarak kurtarmaktır. Topluluk boyutları ve olasılık matrisi bilinebilir[4] veya bilinmiyor.[5]

İstatistiksel alt sınırlar ve eşik davranışı

Stokastik blok modelleri keskin bir sınır etkisi hatırlatan süzülme eşikleri.[6][2][7] Boyuta izin verdiğimizi varsayalım Topluluk boyutlarını sabit oranlarda tutarak grafiğin büyümesi. Olasılık matrisi sabit kalırsa, kısmi ve tam kurtarma gibi görevler dejenere olmayan tüm parametre ayarları için uygulanabilir hale gelir. Ancak, olasılık matrisini aşağıdaki gibi uygun bir oranda küçültürsek artarsa, keskin bir faz geçişi gözlemleriz: Parametrelerin belirli ayarları için, 1'e eğilimli olasılıkla geri kazanım elde etmek mümkün olurken, parametre eşiğinin karşı tarafında, hangi algoritma olursa olsun, kurtarma olasılığı 0'a meyillidir. kullanıldı.

Kısmi kurtarma için uygun ölçeklendirme, sabit için , sabit ortalama derece grafiklerle sonuçlanır. Eşit büyüklükte iki topluluk olması durumunda, olasılık matrisine sahip çeşitli ekili bölüm modelinde

kısmi kurtarma yapılabilir[3] olasılıkla her ne zaman oysa herhangi tahminci başarısız[2] olasılıkla kısmi kurtarma her ne zaman .

Tam iyileşme için uygun ölçeklendirme, , logaritmik ortalama derece grafikleriyle sonuçlanır. Burada benzer bir eşik vardır: çeşitli ekili bölme modeli için eşit büyüklükteki topluluklar, eşik . Aslında, tam geri kazanım eşiği, tamamen genel stokastik blok modeli için bilinmektedir.[4]

Algoritmalar

Prensip olarak, tam kurtarma, uygun aralıkta kullanılarak çözülebilir. maksimum olasılık, ancak bu, kısıtlı bir veya Düzenlenmiş tipik olarak minimum ikiye bölme gibi kesme problemi NP tamamlandı. Bu nedenle, bilinen hiçbir verimli algoritma, en kötü durumda maksimum olasılık tahminini doğru bir şekilde hesaplayamaz.

Bununla birlikte, çok çeşitli algoritmalar ortalama durumda iyi performans gösterir ve hem kısmi hem de tam kurtarma ayarlarında algoritmalar için birçok yüksek olasılıklı performans garantisi kanıtlanmıştır. Başarılı algoritmalar şunları içerir: spektral kümeleme köşelerin[8][3][4][9] yarı belirsiz programlama,[1][7], biçimleri inanç yayılımı,[6][10]ve topluluk algılama [11] diğerleri arasında.

Varyantlar

Modelin birkaç çeşidi mevcuttur. Bir küçük ince ayar, köşeleri topluluklara rastgele bir şekilde ayırır. kategorik dağılım sabit bir bölüm yerine.[4] Daha önemli varyantlar geometrik blok modelini içerir[12] , sansürlü blok modeli ve karma üyeli blok modeli.[13]

Konu modelleri

Stokastik Blok Modeli, bir konu modeli iki taraflı ağlarda [14]. Bir belge ve kelime ağında, Stokastik Blok Modeli konuları tanımlayabilir: benzer bir anlama sahip kelime grupları.

Referanslar

  1. ^ a b c Amini, Arash A .; Levina, Elizaveta (Haziran 2014). "Blok modeli için yarı kesin gevşemelerde". arXiv:1406.5647 [cs.LG ].
  2. ^ a b c Mossel, Elchanan; Neeman, Joe; Sly, Allan (Şubat 2012). "Stokastik Blok Modelleri ve Yeniden Yapılandırma". arXiv:1202.1499 [math.PR ].
  3. ^ a b c Massoulie, Laurent (Kasım 2013). "Topluluk algılama eşikleri ve zayıf Ramanujan özelliği". arXiv:1311.3085 [cs.SI ].
  4. ^ a b c d Abbe, Emmanuel; Sandon, Colin (Mart 2015). "Genel stokastik blok modellerinde topluluk algılama: temel sınırlar ve verimli kurtarma algoritmaları". arXiv:1503.00609 [math.PR ].
  5. ^ Abbe, Emmanuel; Sandon, Colin (Haziran 2015). "Genel stokastik blok modelindeki toplulukları parametreleri bilmeden kurtarmak". arXiv:1506.03729 [math.PR ].
  6. ^ a b Decelle, Aurelien; Krzakala, Florent; Moore, Cristopher; Zdeborová, Lenka (Eylül 2011). "Modüler ağlar ve algoritmik uygulamaları için stokastik blok modelinin asimptotik analizi". Fiziksel İnceleme E. 84 (6): 066106. arXiv:1109.3041. Bibcode:2011PhRvE..84f6106D. doi:10.1103 / PhysRevE.84.066106. PMID  22304154.
  7. ^ a b Abbe, Emmanuel; Bandeira, Afonso S .; Hall, Georgina (Mayıs 2014). "Stokastik Blok Modelinde Tam Kurtarma". arXiv:1405.3267 [cs.SI ].
  8. ^ Krzakala, Florent; Moore, Cristopher; Mossel, Elchanan; Neeman, Joe; Sly, Allan; Lenka, Lenka; Zhang, Pan (Ekim 2013). "Seyrek ağları kümelemede spektral itfa". Ulusal Bilimler Akademisi Bildiriler Kitabı. 110 (52): 20935–20940. arXiv:1306.5550. Bibcode:2013PNAS..11020935K. doi:10.1073 / pnas.1312486110. PMC  3876200. PMID  24277835.
  9. ^ Lei, Jing; Rinaldo, Alessandro (Şubat 2015). "Stokastik blok modellerinde spektral kümelenmenin tutarlılığı". İstatistik Yıllıkları. 43 (1): 215–237. arXiv:1312.2050. doi:10.1214 / 14-AOS1274. ISSN  0090-5364.
  10. ^ Mossel, Elchanan; Neeman, Joe; Sly, Allan (Eylül 2013). "İnanç Yayılımı, Sağlam Yeniden Yapılandırma ve Blok Modellerinin Optimal Kurtarılması". Uygulamalı Olasılık Yıllıkları. 26 (4): 2211–2256. arXiv:1309.1380. Bibcode:2013arXiv1309.1380M. doi:10.1214 / 15-AAP1145.
  11. ^ Fathi, Reza (Nisan 2019). "Stokastik Blok Modelinde Etkin Dağıtılmış Topluluk Algılama". arXiv:1904.07494 [cs.DC ].
  12. ^ Galhotra, Sainyam; Mazumdar, Arya; Pal, Soumyabrata; Saha, Barna (Şubat 2018). "Geometrik Blok Modeli". AAAI. arXiv:1709.05510.
  13. ^ Airoldi, Edoardo; Blei, David; Feinberg, Stephen; Xing, Eric (Mayıs 2007). "Karışık üyelik stokastik blok modelleri". Makine Öğrenimi Araştırmaları Dergisi: JMLR. 9: 1981–2014. arXiv:0705.4485. Bibcode:2007arXiv0705.4485A. PMC  3119541. PMID  21701698.
  14. ^ Martin Gerlach; Tiago Peixoto; Eduardo Altmann (2018). "Konu modellerine ağ yaklaşımı". Bilim Gelişmeleri. 4 (7): eaaq1360. arXiv:1708.01677. Bibcode:2018SciA .... 4.1360G. doi:10.1126 / sciadv.aaq1360. PMC  6051742. PMID  30035215.