Dereceyi koruyan randomizasyon - Degree-preserving randomization

Derece Korumalı Randomizasyon kullanılan bir tekniktir Ağ Bilimi belirli bir grafikte gözlemlenen varyasyonların, gözlenen bir ağdaki düğümlere özgü özelliklerden ziyade, grafiğin doğal yapısal özelliklerinin basit bir yapaylığı olup olmadığını değerlendirmeyi amaçlamaktadır.

Arka fon

1996 gibi erken bir tarihte kataloglanmış,^[1] Randomizasyonu koruyan derecenin en basit uygulaması, bir Monte Carlo Ağı rastgele yeniden düzenleyen veya "yeniden bağlayan" algoritma, yeterli sayıda yeniden tel ile, ağın derece dağılımı ağın ilk derece dağılımı ile aynıdır, ancak ağın topolojik yapısı ağdan tamamen farklı hale gelmiştir. orijinal ağ.

Derece Koruma Rastgeleleştirme algoritmasının tek bir yinelemesinin gösterimi.

Dereceyi koruyan randomizasyon, birçok farklı biçime sahip olmasına rağmen, genellikle nispeten basit bir yaklaşım biçimini alır: aşağıdakilerden oluşan herhangi bir ağ için ${ displaystyle N}$ ile düğümler ${ displaystyle E}$ kenarlar, ikili olarak bağlı iki düğüm seçin. Bu ikili çiftlerin her biri için, yeni çift çiftlerin uyumsuz olacağı şekilde kenarları değiştirin. Yeterli sayıda bu uyuşmazlığın ardından, ağ, orijinal gözlemlenen topografyasını giderek daha fazla kaybeder.

Temel alınan algoritmalarda yaygın olduğu gibi Markov zincirleri, belirli bir grafikte meydana gelmesi gereken yinelemelerin veya tek tek yeniden tellerin sayısı, bu şekilde grafiğin yeterince rastgele ve orijinal grafikten farklı olmasına karşın, Espinoza bilinmemektedir.^[2] güvenli bir minimum eşiğin olduğunu iddia eder ${ displaystyle Q * E}$ , nerede ${ displaystyle Q}$ "en az 100" (Espinoza). Başkaları bu sorun için girdi sağlamışlardır, bunlara güvenli bir asgari bunun yerine en azından ${ displaystyle { frac {E} {2}} * ln (1 / epsilon)}$ , epsilon bir aralıkta yer alır ${ displaystyle 10 ^ {- 6}}$ ve ${ displaystyle 10 ^ {- 7}}$ ancak nihayetinde doğru sayı şu anda bilinmemektedir.^[3]^[4]

Kullanımlar

Yayınlanmış araştırmanın, ağ özelliklerini analiz etmek için rasgeleleştirmeyi koruyarak açıkça kullandığı birkaç durum vardır. Dekker^[5] ikincil bir değişken ekleyerek gözlemlenen sosyal ağları daha doğru bir şekilde modellemek için yeniden kablolama kullandı, ${ displaystyle pi}$ , yüksek dereceli bir bağlantı önyargısı ortaya çıkarır. Liu vd.^[6] ek olarak rasgele seçmeyi koruyan derece kullanmışlardır. Kontrol Merkezliği, belirledikleri bir metrik, bir kontrolün Kontrol Merkeziliği ile karşılaştırıldığında çok az değişiklik gösterir. Erdős-Rényi modeli aynı sayıda içeren ${ displaystyle N}$ simülasyonlarında düğümler - Liu ve ark. daha sonraki araştırmalarda dereceyi koruyan randomizasyon modellerini de kullanmışlardır. ağ denetlenebilirliği.^[7]

Ek olarak, bir endişe nedeni olduğu gösterilen ağ bağlantılı veri araştırmalarında anonimlik hususlarını ele alırken Dereceyi Koruma Randomizasyonunun nasıl kullanılabileceğini araştırmak için bazı çalışmalar yapılmıştır. Sosyal Ağ Analizi Lewis ve diğerleri tarafından yapılan bir çalışmada olduğu gibi.^[8]^[9] Nihayetinde Ying ve Wu tarafından yürütülen, Dereceyi Koruma Rastgeleleştirme temelinden başlayarak ve daha sonra çeşitli değişiklikleri ileten çalışma, gözlenen ağın temeldeki faydasının bütünlüğünden ödün vermeden anonimliğin korunmasında makul ilerlemeler gösterdi.^[10]

Ek olarak, yöntem doğası gereği yaygın olarak kullanılana benzerdir. Üstel rastgele grafik modelleri sosyal bilimlerde popülerleşti,^[11]^[12] ve gerçekten de gerçek ağlarda ifade edilen farklılıkları belirlemek ve teorileştirmek için gözlenen ağlara karşı çeşitli modelleme ağları. Daha da önemlisi, Dereceyi Koruma Rastgeleleştirme, programlamaya aşina olanlar için mevcut bir gözlemlenen ağa bir model uygulamak için basit bir algoritmik tasarım sağlar.

Misal

Aşağıda, ağın derece dağılım yönünü korurken rastgele varyasyona karşı ağı anlamak için gözlemlenen bir ağa Derece Koruma Rastgeleleştirme uygulanabileceğini gösteren küçük bir örnek verilmiştir. İnternet Araştırmacıları Derneği var Listeler bu, çalışmalarını çevreleyen tartışma konularının çoğunu oluşturur. Bunun üzerine, üyeler kendi araştırmaları, yaklaşan konferanslar, bildiri çağrıları hakkında güncellemeler yayınlar ve ayrıca kendi alanlarında önemli tartışmalara katılırlar. Bu e-postalar sırayla yönlendirilmiş ve geçici bir ağ grafiği oluşturabilir; burada düğümler, Listerv'e ait bireysel e-posta hesaplarıdır ve kenarlar, bir e-posta adresinin Listerv'deki başka bir e-posta adresine yanıt verdiği durumlardır.

Derece Korumalı Randomizasyon Denemelerinden Sonuçlar.

Gözlenen bu ağda, Listerv'in özelliklerinin hesaplanması nispeten basittir - 3.235 bireysel e-posta hesabı ve toplamda 9.824 değişim ağı için, mütekabiliyet ağın% 0.074'ü ve [Ortalama yol uzunluğu | ortalama yol uzunluğu] yaklaşık 4.46'dır. Bu değerlere basitçe ağın içsel yapısının doğası yoluyla ulaşılabilir mi?

Uygulama ${ displaystyle { frac {E} {2}} * ln (1 / epsilon)}$ kural olarak, bu ağ, muhtemelen yeterince rastgele derecede korunmuş bir grafik oluşturmak için yaklaşık 67.861 ayrı kenar teline ihtiyaç duyacaktır. Gerçek grafikten birçok rastgele, derece koruyan grafik oluşturursak, daha sonra karşılıklılık ve ortalama yol uzunluğu gibi özellikler için bir olasılık alanı oluşturabilir ve ağın bu özellikleri rastgele ifade edebilme derecesini değerlendirebiliriz. Derece Korumalı Randomizasyon kullanılarak 534 ağ oluşturuldu. Bu grafikte hem karşılıklılık hem de ortalama yol uzunluğu normal olarak dağıtıldığından ve hem karşılıklılık hem de ortalama yol uzunluğu için standart sapma, gözlemlenen durumu içeremeyecek kadar dar olduğundan, bu ağın, olmayan özellikleri ifade ettiğini makul bir şekilde varsayabiliriz. rastgele (ve dolayısıyla daha fazla teori ve modellemeye açık).

Referanslar

^ Rao, A Ramachandra; Jana, Rabindranath; Bandyopadhyay, Suraj (1996). "Verilen marjinallere sahip rastgele (0, 1) -matrisler oluşturmak için bir Markov zinciri Monte Carlo yöntemi" (PDF). Indian Journal of Statistics Series A. Alındı 5 Kasım 2014.
^ Espinoza, Max. "Ağ Üzerinde Randomizasyon Yöntemleri: Negatif Kontrol Çalışması" (PDF). Alıntı dergisi gerektirir | günlük = (Yardım)
^ Re: [igraph] Büyük bir grafiğin derece koruyarak yeniden kablolanması
^ Pınar, Ali; Ray, Jaideep; Seshadri, S. (2012), Henüz varmadık mı? Rastgele grafikler oluştururken bir Markov zinciri ne zaman durdurulur? (PDF), arXiv:1202.3473, Bibcode:2012arXiv1202.3473R
^ Dekker, AH (2007), "Ağı Yeniden Bağlamayı Kullanan Simülasyon için Gerçekçi Sosyal Ağlar" (PDF), Bildiriler MODSIM 2007
^ Liu, Y-Y .; Slotin, J-J; Barabási, A-L (2012), "Karmaşık Ağlarda Kontrol Merkeziliği ve Hiyerarşik Yapı", PLoS ONE, 7 (9): e44459, arXiv:1203.2655, Bibcode:2012PLoSO ... 744459L, doi:10.1371 / journal.pone.0044459, PMC 3459977, PMID 23028542
^ Liu, Yang-Yu; Slotine, Jean-Jacques; Barabási, Albert-Laszlo (2013), "Korelasyonların ağ kontrol edilebilirliği üzerindeki etkisi", Sci. Rep., 3: 1067, arXiv:1203.5161, Bibcode:2013NatSR ... 3E1067P, doi:10.1038 / srep01067, PMC 3545232, PMID 23323210
^ Parry, Marc (10 Temmuz 2011), "Harvard Araştırmacıları Öğrencilerin Gizliliğini İhlal Etmekle Suçlandı", Yüksek Öğrenim Chronicle, alındı 5 Kasım 2014
^ Lewis, Kevin; Kaufman, Jason; Gonzalez, Marco; Wimmer, Andreas; Christakis, Nicholas (2008), "Zevkler, bağlar ve zaman: Facebook.com'u kullanan yeni bir sosyal ağ veri kümesi" (PDF), Sosyal ağlar, 30 (4): 330–342, CiteSeerX 10.1.1.158.9087, doi:10.1016 / j.socnet.2008.07.002
^ Ying, Xiaowei; Wu, Xintao (2008), "Sosyal Ağları Randomize Etmek: Spektrum Koruma Yaklaşımı", SDM: 739–750, CiteSeerX 10.1.1.140.6647, doi:10.1137/1.9781611972788.67, ISBN 978-0-89871-654-2
^ Snijders, Tom AB. (2002), "Üstel rasgele grafik modellerinin Markov zinciri Monte Carlo tahmini", Sosyal Yapı Dergisi, 3 (2): 1–40
^ Robins, Garry; Patterson, Pip; Kalish, Yuval; Lusher, Dean (2007), "Sosyal ağlar için üstel rastgele grafik modellerine giriş", Sosyal ağlar, 29 (2): 173–191, doi:10.1016 / j.socnet.2006.08.002, hdl:1959.3/216571

Dış bağlantılar

Örneğin veri kümesi sağlanmıştır

[1] Rao, A Ramachandra; Jana, Rabindranath; Bandyopadhyay, Suraj (1996). "Verilen marjinallere sahip rastgele (0, 1) -matrisler oluşturmak için bir Markov zinciri Monte Carlo yöntemi" (PDF). Indian Journal of Statistics Series A. Alındı 5 Kasım 2014.

[2] Espinoza, Max. "Ağ Üzerinde Randomizasyon Yöntemleri: Negatif Kontrol Çalışması" (PDF). Alıntı dergisi gerektirir | günlük = (Yardım)

[3] Re: [igraph] Büyük bir grafiğin derece koruyarak yeniden kablolanması

[4] Pınar, Ali; Ray, Jaideep; Seshadri, S. (2012), Henüz varmadık mı? Rastgele grafikler oluştururken bir Markov zinciri ne zaman durdurulur? (PDF), arXiv:1202.3473, Bibcode:2012arXiv1202.3473R

[5] Dekker, AH (2007), "Ağı Yeniden Bağlamayı Kullanan Simülasyon için Gerçekçi Sosyal Ağlar" (PDF), Bildiriler MODSIM 2007

[6] Liu, Y-Y .; Slotin, J-J; Barabási, A-L (2012), "Karmaşık Ağlarda Kontrol Merkeziliği ve Hiyerarşik Yapı", PLoS ONE, 7 (9): e44459, arXiv:1203.2655, Bibcode:2012PLoSO ... 744459L, doi:10.1371 / journal.pone.0044459, PMC 3459977, PMID 23028542

[7] Liu, Yang-Yu; Slotine, Jean-Jacques; Barabási, Albert-Laszlo (2013), "Korelasyonların ağ kontrol edilebilirliği üzerindeki etkisi", Sci. Rep., 3: 1067, arXiv:1203.5161, Bibcode:2013NatSR ... 3E1067P, doi:10.1038 / srep01067, PMC 3545232, PMID 23323210

[8] Parry, Marc (10 Temmuz 2011), "Harvard Araştırmacıları Öğrencilerin Gizliliğini İhlal Etmekle Suçlandı", Yüksek Öğrenim Chronicle, alındı 5 Kasım 2014

[9] Lewis, Kevin; Kaufman, Jason; Gonzalez, Marco; Wimmer, Andreas; Christakis, Nicholas (2008), "Zevkler, bağlar ve zaman: Facebook.com'u kullanan yeni bir sosyal ağ veri kümesi" (PDF), Sosyal ağlar, 30 (4): 330–342, CiteSeerX 10.1.1.158.9087, doi:10.1016 / j.socnet.2008.07.002

[10] Ying, Xiaowei; Wu, Xintao (2008), "Sosyal Ağları Randomize Etmek: Spektrum Koruma Yaklaşımı", SDM: 739–750, CiteSeerX 10.1.1.140.6647, doi:10.1137/1.9781611972788.67, ISBN 978-0-89871-654-2

[11] Snijders, Tom AB. (2002), "Üstel rasgele grafik modellerinin Markov zinciri Monte Carlo tahmini", Sosyal Yapı Dergisi, 3 (2): 1–40

[12] Robins, Garry; Patterson, Pip; Kalish, Yuval; Lusher, Dean (2007), "Sosyal ağlar için üstel rastgele grafik modellerine giriş", Sosyal ağlar, 29 (2): 173–191, doi:10.1016 / j.socnet.2006.08.002, hdl:1959.3/216571

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]