Büyüyen kendi kendini organize eden harita - Growing self-organizing map

Bir büyüyen kendi kendini organize eden harita (GSOM) büyüyen bir varyantıdır kendi kendini organize eden harita (SOM). GSOM, içinde uygun bir harita boyutu belirleme sorununu ele almak için geliştirilmiştir. SOM. En az sayıda düğümle (genellikle 4) başlar ve bir buluşsal yönteme dayalı olarak sınırda yeni düğümler büyütür. Veri analisti, Yayılma Faktörü (SF) adı verilen değeri kullanarak GSOM'un büyümesini kontrol etme yeteneğine sahiptir.

GSOM'un tüm başlangıç düğümleri sınır düğümleridir, yani her düğüm başlangıçta kendi yönünde büyüme özgürlüğüne sahiptir. (Şekil 1) Yeni Düğümler, sınır düğümlerinden büyütülür. Büyümek için bir düğüm seçildikten sonra, tüm serbest komşu konumları yeni düğümler geliştirilecektir. Şekilde dikdörtgen bir GSOM için üç olası düğüm büyütme seçeneği gösterilmektedir.

GSOM'daki düğüm büyütme seçenekleri: (a) bir yeni düğüm, (b) iki yeni düğüm ve (c) üç yeni düğüm.

Algoritma

GSOM süreci aşağıdaki gibidir:

Başlatma aşaması:
1. Başlangıç düğümlerinin ağırlık vektörlerini (genellikle dört) 0 ile 1 arasında rastgele sayılarla başlatın.
2. Büyüme eşiğini hesaplayın ( ${ displaystyle GT}$ ) verilen boyut veri kümesi için ${ displaystyle D}$ yayılma faktörüne göre ( ${ displaystyle SF}$ ) formülü kullanarak ${ displaystyle GT = -D times ln (SF)}$
Büyüme Aşaması:
1. Ağa giriş sunun.
2. Öklid mesafesini (benzer şekilde) kullanarak, geçerli özellik haritasına (kazanan) eşlenen girdi vektörüne en yakın ağırlık vektörünü belirleyin. SOM ). Bu adım şu şekilde özetlenebilir: bul ${ displaystyle q '}$ öyle ki ${ displaystyle sol | v-w_ {q '} sağ vert leq sol | v-w_ {q} sağ vert forall q içinde mathbb {N}}$ nerede ${ displaystyle v}$ , ${ displaystyle w}$ sırasıyla girdi ve ağırlık vektörleridir, ${ displaystyle q}$ düğümler için konum vektörü ve ${ displaystyle mathbb {N}}$ doğal sayılar kümesidir.
3. Ağırlık vektörü uyarlaması yalnızca kazananın bulunduğu mahalleye ve kazananın kendisine uygulanır. Mahalle, kazananın etrafındaki bir dizi nörondur, ancak GSOM'da ağırlık adaptasyonu için seçilen başlangıç bölgesi, SOM'a (lokalize ağırlık adaptasyonu) kıyasla daha küçüktür. Adaptasyon miktarı (öğrenme oranı) da yinelemelere göre katlanarak azaltılır. Mahalle içinde bile, kazanana daha yakın olan ağırlıklar, uzaktakilere göre daha fazla uyarlanır. Ağırlık adaptasyonu şu şekilde tanımlanabilir: ${ displaystyle w_ {j} (k + 1) = { başla {vakalar} w_ {j} (k) & { text {if}} j notin mathrm {N} _ {k + 1} w_ {j} (k) + LR (k) times (x_ {k} -w_ {j} (k)) & { text {if}} j in mathrm {N} _ {k + 1} end {vakalar}}}$ Öğrenme Oranı nerede ${ displaystyle LR (k)}$ , ${ displaystyle k in mathbb {N}}$ sıfıra yakınsayan pozitif parametreler dizisidir ${ displaystyle k ila infty}$ . ${ displaystyle w_ {j} (k)}$ , ${ displaystyle w_ {j} (k + 1)}$ düğümün ağırlık vektörleridir ${ displaystyle j}$ adaptasyondan önce ve sonra ve ${ displaystyle mathrm {N} _ {k + 1}}$ kazanan nöronun mahallesi ${ displaystyle (k + 1)}$ inci yineleme. Azalan değeri ${ displaystyle LR (k)}$ GSOM'da, haritada o anda mevcut olan düğüm sayısına bağlıdır ${ displaystyle k}$ .
4. Kazananın hata değerini artırın (hata değeri, giriş vektörü ile ağırlık vektörleri arasındaki farktır).
5. Ne zaman ${ displaystyle TE_ {i}> GT}$ (nerede ${ displaystyle TE_ {i}}$ düğümün toplam hatasıdır ${ displaystyle i}$ ve ${ displaystyle GT}$ büyüme eşiğidir). İ bir sınır düğümü ise düğümleri büyütün. Ağırlıkları komşularınıza dağıtın ${ displaystyle i}$ sınır olmayan bir düğümdür.
6. Yeni düğüm ağırlık vektörlerini komşu düğüm ağırlıklarıyla eşleşecek şekilde başlatın.
7. Öğrenme oranını başlatın ( ${ displaystyle LR}$ ) başlangıç değerine.
8. Tüm girişler sunulana ve düğüm büyümesi minimum düzeye düşene kadar 2-7 arasındaki adımları tekrarlayın.
Yumuşatma aşaması.
1. Öğrenme oranını azaltın ve küçük bir başlangıç mahallesini düzeltin.
2. Kazananı bulun ve kazananın ve komşuların ağırlıklarını büyüme aşamasında olduğu gibi ayarlayın.

1B SOM (üst sıra) ve GSOM (alt sıra) 50 (ilk sütun) ve 100 (ikinci sütun) düğüm ile gürültülü bir spiralin yaklaştırılması. Açıklanamayan varyans oranı a)% 4,68 (SOM, 50 düğüm); b)% 1,69 (SOM, 100 düğüm); c)% 4.20 (GSOM, 50 düğüm); d)% 2.32 (GSOM, 100 düğüm). SOM için ilk yaklaşım, veri setiyle aynı varyansa sahip birinci temel bileşen üzerindeki bir segmentteki düğümlerin eşit dağıtılmasıydı. GSOM için ilk yaklaşım, ortalama noktadır.^[1]

Başvurular

GSOM, birçok ön işleme görevi için kullanılabilir. Veri madenciliği, için Doğrusal olmayan boyutluluk azaltma, temel eğrilerin ve manifoldların yaklaştırılması için, kümeleme ve sınıflandırma. Genellikle veri geometrisinin SOM'dan daha iyi temsilini sağlar (soldaki ana eğriler için klasik kıyaslama bakın).

Referanslar

^ Çizim, ücretsiz yazılım kullanılarak hazırlanmıştır: E.M. Mirkes, Temel Bileşen Analizi ve Kendi Kendini Düzenleyen Haritalar: uygulama. Leicester Üniversitesi, 2011.

Kaynakça

Liu, Y .; Weisberg, R.H .; O, R. (2006). "Büyüyen hiyerarşik kendi kendini düzenleyen haritaları kullanarak Batı Florida Sahanlığı'ndaki deniz yüzeyi sıcaklığı modelleri". Journal of Atmospheric and Oceanic Technology. 23 (2): 325–338. Bibcode:2006JAtOT..23..325L. doi:10.1175 / JTECH1848.1. hdl:1912/4186.
Hsu, A .; Tang, S .; Halgamuge, S. K. (2003). "Kanser sınıfı keşfine ve mikrodizi verilerinde işaretleyici gen tanımlamasına yönelik denetimsiz, hiyerarşik dinamik, kendi kendini organize eden bir yaklaşım". Biyoinformatik. 19 (16): 2131–2140. doi:10.1093 / biyoinformatik / btg296. PMID 14594719.
Alahakoon, D., Halgamuge, S. K. ve Sirinivasan, B. (2000) Bilgi Keşfi için Kontrollü Büyüme ile Dinamik Kendi Kendini Düzenleyen Haritalar, Sinir Ağlarında IEEE İşlemleri, Bilgi Keşfi ve Veri Madenciliği Özel Sayısı, 11, s. 601–614.
Alahakoon, D., Halgamuge, S. K. ve Sirinivasan, B. (1998) 5. Uluslararası Sinirsel Bilgi İşleme Konferansı (ICONIP 98) Bildirilerinde Optimal Küme Temsili için Özellik Haritası Uyarlayan Bir Yapı Haritası, Kitakyushu, Japonya, s. 809–812
Alahakoon, D., Halgamuge, S. K. ve Sirinivasan, B. (1998) IEEE Uluslararası Sistemler, İnsan ve Sibernetik Konferansı Bildirilerinde Veri Madenciliğine Kendi Kendini Büyüyen Küme Geliştirme Yaklaşımı, San Diego, ABD, s. 2901–2906
Alahakoon, D. ve Halgamuge, S. K. (1998) 5. Uluslararası Yumuşak Hesaplama ve Bilgi / Akıllı Sistemler Konferansı Bildirilerinde Denetimli ve Denetimsiz Kendi Kendine Evrilen Sinir Ağları ile Bilgi Keşfi, Fukuoka, Japonya, s. 907–910

Ayrıca bakınız

[1] Çizim, ücretsiz yazılım kullanılarak hazırlanmıştır: E.M. Mirkes, Temel Bileşen Analizi ve Kendi Kendini Düzenleyen Haritalar: uygulama. Leicester Üniversitesi, 2011.

[1]