Çok değişkenli karşılıklı bilgi - Multivariate mutual information

Venn şeması sırasıyla sol alt, sağ alt ve üst dairelerle temsil edilen üç değişken x, y ve z için bilgi teorik ölçümleri. Çok değişkenli karşılıklı bilgi gri bölge ile temsil edilir. Negatif olabileceğinden, diyagramdaki alanlar şunu temsil eder: imzalı önlemler.

İçinde bilgi teorisi Yıllar boyunca tanımını genişletmek için çeşitli girişimler olmuştur. karşılıklı bilgi ikiden fazla rastgele değişkenler. Çok değişkenli yüksek dereceli karşılıklı bilginin ifadesi ve çalışması, görünüşte bağımsız iki çalışmada elde edildi: McGill (1954) [1] bu işlevleri "etkileşim bilgisi" olarak adlandıran ve Hu Kuo Ting (1962) [2] 2'den yüksek dereceler için karşılıklı bilginin olası olumsuzluğunu ilk kez kanıtlayan ve cebirsel olarak Venn diyagramlarına sezgisel yazışmayı haklı çıkaran [3].

Tanım

koşullu karşılıklı bilgi endüktif olarak tanımlamak için kullanılabilir çok değişkenli karşılıklı bilgi (MMI) bir sette veya ölçü-teorik anlamda bağlamında bilgi diyagramları. Bu anlamda çok değişkenli karşılıklı bilgiyi şu şekilde tanımlıyoruz:

nerede

Bu tanım ile aynıdır etkileşim bilgisi tek sayıda rastgele değişken olması durumunda işaretteki bir değişiklik hariç.

Alternatif olarak, çok değişkenli karşılıklı bilgi, bireysel entropilerin kesişimi olarak ölçü-teorik terimlerle tanımlanabilir. :

Tanımlama , küme teorik özdeşlik hangi ölçü-teorik ifadeye karşılık gelir ,[4]:s sayfa 63 yukarıdakilerin şu şekilde yeniden yazılmasına izin verir:

ki bu ilk tanımla aynıdır.

Özellikleri

Çok değişkenli bilgi ve koşullu çok değişkenli bilgi, bir entropi toplamına ayrıştırılabilir.

Çok değişkenli istatistiksel bağımsızlık

Çok değişkenli karşılıklı bilgi fonksiyonları, ikili bağımsızlık durumunu genelleştirir. ancak ve ancak , keyfi çok sayıda değişkene. n değişkenleri karşılıklı olarak bağımsızdır ancak ve ancak karşılıklı bilgi fonksiyonları kaybolur ile (teorem 2 [3]). Bu anlamda rafine bir istatistiksel bağımsızlık kriteri olarak kullanılabilir.

Sinerji ve artıklık

Çok değişkenli karşılıklı bilgi pozitif, negatif veya sıfır olabilir. Pozitiflik, ikili korelasyonları genelleyen ilişkilere karşılık gelir, sıfırlık, rafine bir bağımsızlık kavramına karşılık gelir ve olumsuzluk, yüksek boyutlu "ortaya çıkan" ilişkileri ve kümelenmiş veri noktalarını tespit eder. [5][3]). Üç değişkenli en basit durum için X, Y, ve Zbilerek söyle X hakkında belirli miktarda bilgi verir Z. Bu bilgi sadece karşılıklı bilgidir (yukarıdaki Venn şemasında sarı ve gri). Aynı şekilde bilmek Y ayrıca hakkında belirli miktarda bilgi verecektir. Zbu karşılıklı bilgi (yukarıdaki Venn şemasında camgöbeği ve gri). Hakkında bilgi miktarı Z her ikisini de bilmekle elde edilen X ve Y birlikte, karşılıklı olan bilgidir Z ve X, Y çift, yazılı (yukarıdaki Venn şemasında sarı, gri ve camgöbeği) ve iki karşılıklı bilginin toplamına eşit veya toplamından daha büyük olabilir, bu fark çok değişkenli karşılıklı bilgidir: . İki karşılıklı bilginin toplamının şu değerden büyük olması durumunda: çok değişkenli karşılıklı bilgi olumlu olacaktır. Bu durumda, bazı bilgiler Z bilerek sağlanan X bilerek de sağlanır Y, toplamlarının ilgili bilgilerden daha büyük olmasına neden olur Z ikisini birlikte bilmekten. Yani bir "fazlalık "hakkındaki bilgilerde Z tarafından sağlanan X ve Y değişkenler. Karşılıklı bilgi toplamının az olması durumunda çok değişkenli karşılıklı bilgi olumsuz olacaktır. Bu durumda, her ikisini de bilmek X ve Y birlikte sağlar Daha hakkında bilgi Z ikisinden birini tek başına bilmekle elde edilen bilgilerin toplamından daha fazla. Yani bir "sinerji "hakkındaki bilgilerde Z tarafından sağlanan X ve Y değişkenler.[6] Yukarıdaki açıklamanın, çok değişkenli karşılıklı bilginin sezgisel bir anlayışını vermesi amaçlanmıştır, ancak hangi değişkenin özne olduğuna bağlı olmadığı gerçeğini gizler (örneğin, Z yukarıdaki örnekte) ve diğer ikisi bilgi kaynağı olarak düşünülmektedir. 3 değişken için Brenner ve ark. sinirsel kodlamaya çok değişkenli karşılıklı bilgiyi uyguladı ve olumsuzluğunu "sinerji" olarak adlandırdı [7] ve Watkinson ve ark. genetik ifadeye uyguladı [8]

Pozitif çok değişkenli karşılıklı bilgi örneği (artıklık)

Pozitif MMI, ortak nedenli yapıların tipik bir örneğidir. Örneğin bulutlar yağmura neden olur ve ayrıca güneşi engeller; bu nedenle, yağmur ve karanlık arasındaki korelasyon kısmen bulutların varlığıyla açıklanır, . Sonuç pozitif MMI .

Negatif çok değişkenli karşılıklı bilgi örnekleri (sinerji)

Xor etkileşimi.png

Negatif MMI vakası rezil bir şekilde sezgisel değildir. Negatifin prototip bir örneği vardır bir XOR geçidinin çıktısı olarak ve bağımsız rastgele girdilerdir. Bu durumda sıfır olacak ama pozitif olacak (1 bit ) beri bir kez çıktı biliniyor, girişteki değer girişteki değeri tamamen belirler . Dan beri , sonuç negatif MMI . Görünüşe göre bu örnek tuhaf bir sıralamaya dayanıyor pozitif etkileşimi elde etmek için, ancak tanımın simetrisi hangi değişken olarak kabul ettiğimizden bağımsız olarak aynı pozitif etkileşim bilgisinin sonuçlandığını gösterir. interloper veya koşullandırma değişkeni. Örneğin, giriş ve çıktı girişe kadar bağımsızdır sabittir ve bu durumda tamamen bağımlıdırlar.

Common-effect.png

Bu durum, ortak etki nedenlerin ve önceden var olmayan nedenler arasında bir bağımlılığa neden olur. Bu davranışa halk arasında şöyle denir: açıklamak ve ayrıntılı olarak tartışılmaktadır Bayes Ağı literatür (örneğin, Pearl 1988). Pearl'ün örneği, otomatik teşhis: Bir arabanın motoru çalışmayabilir bitmiş pil nedeniyle veya tıkalı bir yakıt pompası nedeniyle . Normal olarak, bu tür otomotiv sistemlerinin temel modülerliği nedeniyle, akü ölümü ve yakıt pompası tıkanmasının bağımsız olaylar olduğunu varsayıyoruz. Böylelikle başka bir bilginin yokluğunda akünün bitip bitmediğini bilmek bize yakıt pompasının tıkalı olup olmadığı hakkında bilgi vermez. Ancak, arabanın çalışmadığını bilirsek (yani ortak etkiyi düzeltiriz) ), bu bilgi iki neden arasında bir bağımlılığa neden olur pil ölümü ve yakıt tıkanması. Bu nedenle, aracın çalışmadığını bilerek, bir inceleme akünün sağlıklı olduğunu gösterirse, yakıt pompasının tıkalı olduğu sonucuna varırız.

Pil ölümü ve yakıt tıkanması bu nedenle bağımlıdırlar, ortak etkilerine bağlıdırlar araba çalıştırma. Ortak etki grafiğindeki açık yönlülük, derin bir bilgi simetrisine inanmaktadır: Ortak bir etkiye göre koşullandırma, iki ana neden arasındaki bağımlılığı artırıyorsa, o zaman nedenlerden birine göre koşullandırma, ikinci neden ve ortak neden arasındaki bağımlılıkta aynı artışı yaratmalıdır. etki. Pearl'ün otomotiv örneğinde, koşullandırma açıksa araba başlar indükler iki neden arasındaki bağımlılık bitleri pil bitti ve yakıt tıkalı, sonra şartlandırmayakıt tıkalı indüklemeli arasındaki bağımlılık bitleri pil bitti ve araba başlar. Bu tuhaf görünebilir çünkü pil bitti ve araba başlar ima ile yönetilir pil bitti araba çalışmıyor. Bununla birlikte, bu değişkenler hala tam olarak ilişkilendirilmemiştir çünkü tersi doğru değildir. Koşullandırma yakıt tıkalı Başarısızlığın ana alternatif nedenini ortadan kaldırır ve ters ilişkiyi ve dolayısıyla aralarındaki ilişkiyi güçlendirir. pil bitti ve araba başlar.

Markov Zincirleri için Pozitiflik

Üç değişken bir Markov zinciri oluşturuyorsa , sonra yani

Sınırlar

3 değişkenli durumun sınırları

Zorluklar

Bir komplikasyon, bu çok değişkenli karşılıklı bilginin (aynı zamanda etkileşim bilgisi ) pozitif, negatif veya sıfır olabilir, bu da bu miktarın sezgisel olarak yorumlanmasını zorlaştırır. Aslında için n rastgele değişkenler var bu değişkenlerin her boş olmayan alt kümesine karşılık gelen, bilgi-kuramsal anlamda nasıl ilişkilendirilebileceklerine dair serbestlik dereceleri. Bu serbestlik dereceleri, çeşitli bilgi teorisindeki eşitsizlikler.

Ayrıca bakınız

Referanslar

  1. ^ McGill, W. (1954). "Çok değişkenli bilgi aktarımı". Psychometrika. 19 (1): 97–116. doi:10.1007 / BF02289159.
  2. ^ Hu, K.T. (1962). "Bilgi Miktarı Hakkında". Teori Probab. Appl. 7: 439–447.
  3. ^ a b c Baudot, P .; Tapia, M .; Bennequin, D .; Goaillard, JM. (2019). "Topolojik Bilgi Veri Analizi". Entropi. 21 (9): 869. doi:10.3390 / e21090869.
  4. ^ Cerf, Nicolas J .; Adami, Chris (1998). "Kuantum dolanıklığı ve ölçümünün bilgi teorisi". Physica D. 120 (1–2): 62–81. arXiv:quant-ph / 9605039. Bibcode:1998PhyD..120 ... 62C. doi:10.1016 / s0167-2789 (98) 00045-1. Alındı 7 Haziran 2015.
  5. ^ Tapia, M .; Baudot, P .; Formizano-Treziny, C .; Dufour, M .; Goaillard, J.M. (2018). "Nörotransmiter kimliği ve elektrofizyolojik fenotip, orta beyin dopaminerjik nöronlarda genetik olarak eşleşmiştir". Sci. Rep. 8: 13637. doi:10.1038 / s41598-018-31765-z.
  6. ^ Timme, Nicholas; Alford, Wesley; Flecker, Benjamin; Beggs, John M. (2012). "Çok değişkenli bilgi ölçümleri: bir deneycinin bakış açısı". arXiv:1111.6857. Bibcode:2011arXiv1111.6857T
  7. ^ Brenner, N .; Strong, S .; Koberle, R .; Bialek, W. (2000). "Sinirsel Kodda Sinerji". Sinirsel Bilgisayar. 12: 1531–1552. doi:10.1162/089976600300015259.
  8. ^ Watkinson, J .; Liang, K .; Wang, X .; Zheng, T .; Anastassiou, D. (2009). "Üç Yönlü Karşılıklı Bilgi Kullanılarak İfade Verilerinden Düzenleyici Gen Etkileşimlerinin Çıkarımı". Meydan okuma. Syst. Biol. Ann. N. Y. Acad. Sci. 1158: 302–313. doi:10.1111 / j.1749-6632.2008.03757.x.
  • Noktasal Karşılıklı Bilginin İki Çok Değişkenli Genellemesi
  • Jakulin A ve Bratko I (2003a). Öznitelik Bağımlılıklarını Analiz Etme, N Lavraquad {c}, D Gamberger, L Todorovski & H Blockeel, eds, 7. Avrupa Veritabanlarında Bilgi Keşfi İlkeleri ve Uygulaması Konferansı Bildirileri, Springer, Cavtat-Dubrovnik, Hırvatistan, s. 229–240.