Büyüyen kendi kendini organize eden harita - Growing self-organizing map

Bir büyüyen kendi kendini organize eden harita (GSOM) büyüyen bir varyantıdır kendi kendini organize eden harita (SOM). GSOM, içinde uygun bir harita boyutu belirleme sorununu ele almak için geliştirilmiştir. SOM. En az sayıda düğümle (genellikle 4) başlar ve bir buluşsal yönteme dayalı olarak sınırda yeni düğümler büyütür. Veri analisti, Yayılma Faktörü (SF) adı verilen değeri kullanarak GSOM'un büyümesini kontrol etme yeteneğine sahiptir.

GSOM'un tüm başlangıç ​​düğümleri sınır düğümleridir, yani her düğüm başlangıçta kendi yönünde büyüme özgürlüğüne sahiptir. (Şekil 1) Yeni Düğümler, sınır düğümlerinden büyütülür. Büyümek için bir düğüm seçildikten sonra, tüm serbest komşu konumları yeni düğümler geliştirilecektir. Şekilde dikdörtgen bir GSOM için üç olası düğüm büyütme seçeneği gösterilmektedir.

GSOM'daki düğüm büyütme seçenekleri: (a) bir yeni düğüm, (b) iki yeni düğüm ve (c) üç yeni düğüm.

Algoritma

GSOM süreci aşağıdaki gibidir:

  1. Başlatma aşaması:
    1. Başlangıç ​​düğümlerinin ağırlık vektörlerini (genellikle dört) 0 ile 1 arasında rastgele sayılarla başlatın.
    2. Büyüme eşiğini hesaplayın () verilen boyut veri kümesi için yayılma faktörüne göre () formülü kullanarak
  2. Büyüme Aşaması:
    1. Ağa giriş sunun.
    2. Öklid mesafesini (benzer şekilde) kullanarak, geçerli özellik haritasına (kazanan) eşlenen girdi vektörüne en yakın ağırlık vektörünü belirleyin. SOM ). Bu adım şu şekilde özetlenebilir: bul öyle ki nerede , sırasıyla girdi ve ağırlık vektörleridir, düğümler için konum vektörü ve doğal sayılar kümesidir.
    3. Ağırlık vektörü uyarlaması yalnızca kazananın bulunduğu mahalleye ve kazananın kendisine uygulanır. Mahalle, kazananın etrafındaki bir dizi nörondur, ancak GSOM'da ağırlık adaptasyonu için seçilen başlangıç ​​bölgesi, SOM'a (lokalize ağırlık adaptasyonu) kıyasla daha küçüktür. Adaptasyon miktarı (öğrenme oranı) da yinelemelere göre katlanarak azaltılır. Mahalle içinde bile, kazanana daha yakın olan ağırlıklar, uzaktakilere göre daha fazla uyarlanır. Ağırlık adaptasyonu şu şekilde tanımlanabilir: Öğrenme Oranı nerede , sıfıra yakınsayan pozitif parametreler dizisidir . , düğümün ağırlık vektörleridir adaptasyondan önce ve sonra ve kazanan nöronun mahallesi inci yineleme. Azalan değeri GSOM'da, haritada o anda mevcut olan düğüm sayısına bağlıdır .
    4. Kazananın hata değerini artırın (hata değeri, giriş vektörü ile ağırlık vektörleri arasındaki farktır).
    5. Ne zaman (nerede düğümün toplam hatasıdır ve büyüme eşiğidir). İ bir sınır düğümü ise düğümleri büyütün. Ağırlıkları komşularınıza dağıtın sınır olmayan bir düğümdür.
    6. Yeni düğüm ağırlık vektörlerini komşu düğüm ağırlıklarıyla eşleşecek şekilde başlatın.
    7. Öğrenme oranını başlatın () başlangıç ​​değerine.
    8. Tüm girişler sunulana ve düğüm büyümesi minimum düzeye düşene kadar 2-7 arasındaki adımları tekrarlayın.
  3. Yumuşatma aşaması.
    1. Öğrenme oranını azaltın ve küçük bir başlangıç ​​mahallesini düzeltin.
    2. Kazananı bulun ve kazananın ve komşuların ağırlıklarını büyüme aşamasında olduğu gibi ayarlayın.
1B SOM (üst sıra) ve GSOM (alt sıra) 50 (ilk sütun) ve 100 (ikinci sütun) düğüm ile gürültülü bir spiralin yaklaştırılması. Açıklanamayan varyans oranı a)% 4,68 (SOM, 50 düğüm); b)% 1,69 (SOM, 100 düğüm); c)% 4.20 (GSOM, 50 düğüm); d)% 2.32 (GSOM, 100 düğüm). SOM için ilk yaklaşım, veri setiyle aynı varyansa sahip birinci temel bileşen üzerindeki bir segmentteki düğümlerin eşit dağıtılmasıydı. GSOM için ilk yaklaşım, ortalama noktadır.[1]

Başvurular

GSOM, birçok ön işleme görevi için kullanılabilir. Veri madenciliği, için Doğrusal olmayan boyutluluk azaltma, temel eğrilerin ve manifoldların yaklaştırılması için, kümeleme ve sınıflandırma. Genellikle veri geometrisinin SOM'dan daha iyi temsilini sağlar (soldaki ana eğriler için klasik kıyaslama bakın).

Referanslar

  1. ^ Çizim, ücretsiz yazılım kullanılarak hazırlanmıştır: E.M. Mirkes, Temel Bileşen Analizi ve Kendi Kendini Düzenleyen Haritalar: uygulama. Leicester Üniversitesi, 2011.

Kaynakça

  • Liu, Y .; Weisberg, R.H .; O, R. (2006). "Büyüyen hiyerarşik kendi kendini düzenleyen haritaları kullanarak Batı Florida Sahanlığı'ndaki deniz yüzeyi sıcaklığı modelleri". Journal of Atmospheric and Oceanic Technology. 23 (2): 325–338. Bibcode:2006JAtOT..23..325L. doi:10.1175 / JTECH1848.1. hdl:1912/4186.
  • Hsu, A .; Tang, S .; Halgamuge, S. K. (2003). "Kanser sınıfı keşfine ve mikrodizi verilerinde işaretleyici gen tanımlamasına yönelik denetimsiz, hiyerarşik dinamik, kendi kendini organize eden bir yaklaşım". Biyoinformatik. 19 (16): 2131–2140. doi:10.1093 / biyoinformatik / btg296. PMID  14594719.
  • Alahakoon, D., Halgamuge, S. K. ve Sirinivasan, B. (2000) Bilgi Keşfi için Kontrollü Büyüme ile Dinamik Kendi Kendini Düzenleyen Haritalar, Sinir Ağlarında IEEE İşlemleri, Bilgi Keşfi ve Veri Madenciliği Özel Sayısı, 11, s. 601–614.
  • Alahakoon, D., Halgamuge, S. K. ve Sirinivasan, B. (1998) 5. Uluslararası Sinirsel Bilgi İşleme Konferansı (ICONIP 98) Bildirilerinde Optimal Küme Temsili için Özellik Haritası Uyarlayan Bir Yapı Haritası, Kitakyushu, Japonya, s. 809–812
  • Alahakoon, D., Halgamuge, S. K. ve Sirinivasan, B. (1998) IEEE Uluslararası Sistemler, İnsan ve Sibernetik Konferansı Bildirilerinde Veri Madenciliğine Kendi Kendini Büyüyen Küme Geliştirme Yaklaşımı, San Diego, ABD, s. 2901–2906
  • Alahakoon, D. ve Halgamuge, S. K. (1998) 5. Uluslararası Yumuşak Hesaplama ve Bilgi / Akıllı Sistemler Konferansı Bildirilerinde Denetimli ve Denetimsiz Kendi Kendine Evrilen Sinir Ağları ile Bilgi Keşfi, Fukuoka, Japonya, s. 907–910

Ayrıca bakınız