Radyal temel fonksiyon ağı - Radial basis function network

Nın alanında matematiksel modelleme, bir radyal temel fonksiyon ağı bir yapay sinir ağı o kullanır radyal temel fonksiyonlar gibi aktivasyon fonksiyonları. Ağın çıktısı bir doğrusal kombinasyon girdilerin ve nöron parametrelerinin radyal temel fonksiyonları. Radyal tabanlı işlev ağlarının birçok kullanımı vardır: fonksiyon yaklaşımı, zaman serisi tahmini, sınıflandırma ve sistem kontrol. İlk olarak, Broomhead ve Lowe tarafından 1988 tarihli bir makalede formüle edildi. Kraliyet Sinyalleri ve Radar Kuruluşu.[1][2][3]

Ağ mimarisi

Şekil 1: Radyal tabanlı fonksiyon ağının mimarisi. Bir giriş vektörü her biri farklı parametrelere sahip tüm radyal temel işlevlere girdi olarak kullanılır. Ağın çıktısı, radyal temel fonksiyonların çıktılarının doğrusal bir kombinasyonudur.

Radyal temelli işlev (RBF) ağları tipik olarak üç katmana sahiptir: bir giriş katmanı, doğrusal olmayan bir RBF etkinleştirme işlevine sahip gizli bir katman ve bir doğrusal çıktı katmanı. Girdi, gerçek sayıların bir vektörü olarak modellenebilir . Ağın çıktısı daha sonra giriş vektörünün skaler bir fonksiyonudur, ve tarafından verilir

nerede gizli katmandaki nöronların sayısıdır, nöronun merkez vektörüdür , ve nöronun ağırlığı doğrusal çıkış nöronunda. Yalnızca bir merkez vektörüne olan uzaklığa bağlı olan fonksiyonlar, bu vektöre göre radyal olarak simetriktir, dolayısıyla radyal temel fonksiyon adıdır. Temel formda, tüm girdiler her bir gizli nörona bağlanır. norm tipik olarak şu şekilde alınır Öklid mesafesi (rağmen Mahalanobis mesafesi örüntü tanıma ile daha iyi performans gösteriyor gibi görünüyor[4][5][editörlük ]) ve radyal temel işlevi genellikle Gauss

.

Gauss temel fonksiyonları, merkez vektörüne göre yereldir.

yani, bir nöronun parametrelerini değiştirmek, o nöronun merkezinden uzakta olan girdi değerleri için yalnızca küçük bir etkiye sahiptir.

Aktivasyon işlevinin şeklindeki belirli hafif koşullar göz önüne alındığında, RBF ağları evrensel yaklaşımlar bir kompakt alt kümesi .[6] Bu, yeterli sayıda gizli nörona sahip bir RBF ağının, kapalı, sınırlı bir küme üzerindeki herhangi bir sürekli işlevi keyfi bir hassasiyetle yaklaştırabileceği anlamına gelir.

Parametreler , , ve aradaki uyumu optimize edecek şekilde belirlenir ve veriler.

Şekil 2: Bir girdi boyutunda iki normalize edilmemiş radyal temel fonksiyon. Temel işlev merkezleri şurada bulunur: ve .

Normalleştirilmiş

Şekil 3: Bir girdi boyutunda iki normalleştirilmiş radyal temel fonksiyon (sigmoidler ). Temel işlev merkezleri şu adreste bulunur: ve .
Şekil 4: Bir girdi boyutunda üç normalleştirilmiş radyal temel fonksiyon. Ek temel işlevinin merkezinde
Şekil 5: Bir girdi boyutunda dört normalleştirilmiş radyal temel fonksiyon. Dördüncü temel fonksiyonun merkezi . İlk temel işlevin (koyu mavi) yerelleştirildiğine dikkat edin.

Normalleştirilmiş mimari

Yukarıdakilere ek olarak normalleştirilmemiş mimari, RBF ağları olabilir normalleştirilmiş. Bu durumda eşleme

nerede

"normalleştirilmiş radyal temel fonksiyonu" olarak bilinir.

Normalleşme için teorik motivasyon

Stokastik veri akışı durumunda bu mimari için teorik gerekçelendirme vardır. Varsayalım stokastik çekirdek eklem olasılık yoğunluğu tahmini

ağırlıklar nerede ve verilerden örnekler ve çekirdeklerin normalleştirilmesini istiyoruz

ve

.

Girdi ve çıktı uzaylarındaki olasılık yoğunlukları

ve

Bir girdi verilen y'nin beklentisi dır-dir

nerede

verilen y'nin koşullu olasılığı Koşullu olasılık, ortak olasılıkla ilişkilidir. Bayes teoremi

hangi sonuç verir

.

Bu olur

entegrasyonlar yapıldığında.

Yerel doğrusal modeller

Mimariyi içerecek şekilde genişletmek bazen uygundur. yerel doğrusal modeller. Bu durumda mimariler, ilk sırada,

ve

normalize edilmemiş ve normalize edilmiş durumlarda sırasıyla. Buraya belirlenecek ağırlıklardır. Daha yüksek dereceden doğrusal terimler de mümkündür.

Bu sonuç yazılabilir

nerede

ve

normalleştirilmemiş durumda ve

normalleştirilmiş durumda.

Buraya bir Kronecker delta işlevi olarak tanımlandı

.

Eğitim

RBF ağları tipik olarak giriş ve hedef değer çiftlerinden eğitilir , iki aşamalı bir algoritma ile.

İlk adımda, merkez vektörler gizli katmandaki RBF işlevlerinden biri seçilir. Bu adım birkaç yolla gerçekleştirilebilir; merkezler bazı örneklerden rastgele örneklenebilir veya bunlar kullanılarak belirlenebilir. k-kümeleme anlamına gelir. Bu adımın denetimsiz.

İkinci adım, basitçe katsayıları olan doğrusal bir modele uyar bazı nesnel işlevlerle ilgili olarak gizli katmanın çıktılarına. En azından regresyon / fonksiyon tahmini için ortak bir amaç fonksiyonu, en küçük kareler fonksiyonudur:

nerede

.

Ağırlıklara olan bağımlılığı açıkça dahil ettik. En küçük kareler hedef fonksiyonunun optimum ağırlık seçimi ile en aza indirilmesi, uyum doğruluğunu optimize eder.

Düzgünlük ve doğruluk gibi birden çok hedefin optimize edilmesi gereken durumlar vardır. Bu durumda, düzenli hale getirilmiş bir amaç işlevini optimize etmek yararlıdır.

nerede

ve

S optimizasyonunun düzgünlüğü en üst düzeye çıkardığı ve olarak bilinir düzenleme parametre.

Üçüncü bir isteğe bağlı geri yayılım RBF ağının tüm parametrelerinin ince ayarını yapmak için adım gerçekleştirilebilir.[3]

İnterpolasyon

RBF ağları bir işlevi enterpolasyon yapmak için kullanılabilir bu fonksiyonun değerleri sonlu sayıda noktada bilindiğinde: . Bilinen noktaları almak Radyal temel fonksiyonlarının merkezleri olmak ve temel fonksiyonların değerlerini aynı noktalarda değerlendirmek ağırlıklar denklemden çözülebilir

Yukarıdaki denklemdeki enterpolasyon matrisinin tekil olmadığı gösterilebilir, eğer noktalar farklıdır ve dolayısıyla ağırlıklar basit doğrusal cebir ile çözülebilir:

nerede .

Fonksiyon yaklaşımı

Amaç katı enterpolasyon yapmak değil, bunun yerine daha genel ise fonksiyon yaklaşımı veya sınıflandırma optimizasyon biraz daha karmaşıktır çünkü merkezler için bariz bir seçim yoktur. Eğitim tipik olarak iki aşamada yapılır, önce genişliği ve merkezleri, ardından ağırlıkları sabitler. Bu, doğrusal olmayan gizli nöronların doğrusal çıkış nöronuna karşı farklı doğası dikkate alınarak doğrulanabilir.

Temel işlev merkezlerinin eğitilmesi

Temel işlev merkezleri, girdi örnekleri arasında rastgele örneklenebilir veya Ortogonal En Küçük Kare Öğrenme Algoritması ile elde edilebilir veya kümeleme merkezler olarak örnekler ve kümenin seçilmesi anlamına gelir.

RBF genişlikleri genellikle seçilen merkezler arasındaki maksimum mesafeyle orantılı olan aynı değere sabitlenir.

Doğrusal ağırlıklar için sözde ters çözüm

Merkezlerden sonra düzeltildi, çıktıdaki hatayı en aza indiren ağırlıklar doğrusal bir sözde ters çözüm:

,

girişleri nerede G noktalarında değerlendirilen radyal temel fonksiyonlarının değerleridir : .

Bu doğrusal çözümün varlığı, çok katmanlı algılayıcı (MLP) ağlarından farklı olarak, RBF ağlarının açık bir küçültücüye (merkezler sabitlendiğinde) sahip olduğu anlamına gelir.

Doğrusal ağırlıkların gradyan iniş eğitimi

Başka bir olası eğitim algoritması dereceli alçalma. Gradyan iniş eğitiminde, ağırlıklar her adımda objektif fonksiyonun gradyanının tersi yönde hareket ettirilerek ayarlanır (böylece minimum objektif fonksiyonun bulunmasına izin verilir),

nerede bir "öğrenme parametresidir."

Doğrusal ağırlıkların çalıştırılması durumunda, algoritma olur

normalleştirilmemiş durumda ve

normalleştirilmiş durumda.

Yerel-doğrusal-mimariler için gradyan-iniş eğitimi

Doğrusal ağırlıkların projeksiyon operatörü eğitimi

Doğrusal ağırlıkların çalıştırılması durumunda, ve algoritma olur

normalleştirilmemiş durumda ve

normalleştirilmiş durumda ve

yerel-doğrusal durumda.

Bir temel işlev için, projeksiyon operatörü eğitimi, Newton yöntemi.

Şekil 6: Lojistik harita zaman serileri. Lojistik haritanın tekrarlanan yinelemesi, kaotik bir zaman serisi oluşturur. Değerler sıfır ile bir arasındadır. Burada gösterilenler, bu bölümdeki örnekleri eğitmek için kullanılan 100 eğitim noktasıdır. Ağırlıklar c bu zaman serisinin ilk beş noktasıdır.

Örnekler

Lojistik harita

Radyal temel fonksiyonların temel özellikleri basit bir matematiksel harita ile gösterilebilir. lojistik harita birim aralığını kendisine eşleyen. Uygun bir prototip veri akışı oluşturmak için kullanılabilir. Lojistik harita keşfetmek için kullanılabilir fonksiyon yaklaşımı, zaman serisi tahmini, ve kontrol teorisi. Harita şu alandan çıktı: nüfus dinamikleri ve prototip oldu kaotik Zaman serisi. Tamamen kaotik rejimdeki harita,

t bir zaman indeksidir. T + 1 anındaki x değeri, t anındaki x'in parabolik bir fonksiyonudur. Bu denklem, lojistik harita tarafından oluşturulan kaotik zaman serisinin temelindeki geometriyi temsil eder.

Bu denklemden zaman serisinin oluşturulması, ileri problem. Buradaki örnekler, ters problem; lojistik haritanın temelindeki dinamiklerin veya temel denklemin zaman serilerinin örneklerinden belirlenmesi. Amaç bir tahmin bulmaktır

f için.

Fonksiyon yaklaşımı

Normalleştirilmemiş radyal temel fonksiyonları

Mimari

Şekil 7: Normalleştirilmemiş temel fonksiyonlar. Lojistik harita (mavi) ve eğitim setinden bir geçişten sonra lojistik haritaya (kırmızı) yaklaşma.

nerede

.

Giriş bir skaler yerine vektör girdi boyutu birdir. Temel fonksiyon sayısını N = 5 ve eğitim setinin boyutunu kaotik zaman serilerinin oluşturduğu 100 örnek olacak şekilde seçiyoruz. Ağırlık 5'e eşit bir sabit olarak alınır. zaman serilerinden beş örnektir. Ağırlıklar projeksiyon operatörü eğitimi ile eğitilmiştir:

nerede öğrenme oranı 0.3 olarak alınmıştır. Eğitim, 100 eğitim noktasından tek geçişle gerçekleştirilir. rms hatası 0.15.

Şekil 8: Normalleştirilmiş temel işlevler. Lojistik harita (mavi) ve eğitim setinden bir geçişten sonra lojistik haritaya (kırmızı) yaklaşma. Normalleştirilmemiş duruma göre gelişmeye dikkat edin.

Normalleştirilmiş radyal temel fonksiyonları

Normalleştirilmiş RBF mimarisi

nerede

.

Tekrar:

.

Yine temel fonksiyonların sayısını beş, eğitim setinin boyutunu kaotik zaman serilerinin oluşturduğu 100 örnek olarak seçiyoruz. Ağırlık 6'ya eşit bir sabit olarak alınır. zaman serilerinden beş örnektir. Ağırlıklar projeksiyon operatörü eğitimi ile eğitilmiştir:

nerede öğrenme oranı yine 0,3 olarak alınmıştır. Eğitim, 100 eğitim noktasından tek geçişle gerçekleştirilir. rms hatası 100 örneklik bir test setinde 0.084, normalize edilmemiş hatadan daha küçüktür. Normalleştirme doğruluk artışı sağlar. Normalleştirilmiş temel işlevlerdeki doğruluk, girdi boyutluluğu arttıkça normalleştirilmemiş işlevlere göre daha da artar.

Şekil 9: Normalleştirilmiş temel işlevler. Lojistik harita (mavi) ve zamanın bir fonksiyonu olarak lojistik haritaya (kırmızı) yaklaşma. Yaklaşımın yalnızca birkaç zaman adımı için iyi olduğunu unutmayın. Bu, kaotik zaman serilerinin genel bir özelliğidir.

Zaman serisi tahmini

Zaman serisinin temel geometrisi, önceki örneklerde olduğu gibi tahmin edildikten sonra, yineleme yoluyla zaman serileri için bir tahmin yapılabilir:

.

Gerçek ve tahmini zaman serilerinin bir karşılaştırması şekilde gösterilir. Tahmini zamanlar serisi, tam x (0) bilgisiyle sıfır zamanında başlar. Daha sonra, birkaç zaman adımı için zaman serisi tahminini güncellemek için dinamiklerin tahminini kullanır.

Tahminin yalnızca birkaç zaman adımı için doğru olduğunu unutmayın. Bu, kaotik zaman serilerinin genel bir özelliğidir. Bu, kaotik zaman serilerinde ortak olan başlangıç ​​koşullarına hassas bağımlılığın bir özelliğidir. Küçük bir başlangıç ​​hatası zamanla büyür. Neredeyse aynı başlangıç ​​koşullarına sahip zaman serilerinin sapmasının bir ölçüsü, Lyapunov üssü.

Kaotik bir zaman serisinin kontrolü

Şekil 10: Lojistik haritanın kontrolü. Sistemin 49 zaman adımında doğal olarak gelişmesine izin verilir. 50 zamanında kontrol açılır. Zaman serisi için istenen yörünge kırmızıdır. Kontrol altındaki sistem, temel dinamikleri öğrenir ve zaman serilerini istenen çıktıya yönlendirir. Mimari, zaman serisi tahmin örneğiyle aynıdır.

Lojistik haritanın çıktısının bir kontrol parametresi aracılığıyla manipüle edilebileceğini varsayıyoruz. öyle ki

.

Amaç, kontrol parametresini, zaman serisini istenen bir çıktıya yönlendirecek şekilde seçmektir. . Kontrol parametresini seçersek bu yapılabilir.

nerede

sistemin temelindeki doğal dinamiklere bir yaklaşımdır.

Öğrenme algoritması şu şekilde verilir:

nerede

.

Ayrıca bakınız

Referanslar

  1. ^ Broomhead, D. S .; Lowe, David (1988). Radyal temel fonksiyonlar, çok değişkenli fonksiyonel enterpolasyon ve uyarlanabilir ağlar (Teknik rapor). RSRE. 4148.
  2. ^ Broomhead, D. S .; Lowe, David (1988). "Çok değişkenli işlevsel enterpolasyon ve uyarlanabilir ağlar" (PDF). Karmaşık Sistemler. 2: 321–355.
  3. ^ a b Schwenker, Friedhelm; Kestler, Hans A .; Palm, Günther (2001). "Radyal tabanlı işlev ağları için üç öğrenme aşaması". Nöral ağlar. 14 (4–5): 439–458. CiteSeerX  10.1.1.109.312. doi:10.1016 / s0893-6080 (01) 00027-2. PMID  11411631.
  4. ^ Beheim, Larbi; Zitouni, Adel; Belloir, Fabien (Ocak 2004). "Optimize edilmiş gizli nöron sayısı ile yeni RBF sinir ağı sınıflandırıcısı". CiteSeerX  10.1.1.497.5646.
  5. ^ İbrikçi, Turgay; Brandt, M.E .; Wang, Guanyu; Açıkkar, Mustafa (23–26 Ekim 2002). Mahalanobis mesafesi, protein ikincil yapıları üzerinde radyal temel fonksiyon ağı ile. İkinci Ortak 24. Yıllık Konferansı ve Biyomedikal Mühendisliği Derneği Yıllık Sonbahar Toplantısı Bildirileri. Tıp ve Biyoloji Mühendisliği Derneği, IEEE Yıllık Uluslararası Konferansı Bildirileri. 3. Houston, TX, USA (6 Ocak 2003'te yayınlandı). s. 2184–2185. doi:10.1109 / IEMBS.2002.1053230. ISBN  0-7803-7612-9. ISSN  1094-687X. | erişim-tarihi = gerektirir | url = (Yardım)
  6. ^ Park, J .; I.W. Sandberg (Yaz 1991). "Radyal Temel Fonksiyonlu Ağları Kullanan Evrensel Yaklaşım". Sinirsel Hesaplama. 3 (2): 246–257. doi:10.1162 / neco.1991.3.2.246. PMID  31167308. S2CID  34868087.

daha fazla okuma