BrownBoost - BrownBoost

BrownBoost bir artırma gürültülü veri kümelerine karşı sağlam olabilecek algoritma. BrownBoost uyarlanabilir bir sürümüdür çoğunluk ile artırmak algoritması. Herkes için doğru olduğu gibi artırma BrownBoost diğer algoritmalarla birlikte kullanılır. makine öğrenme yöntemler. BrownBoost, Yoav Freund 2001 yılında.^[1]

Motivasyon

AdaBoost çeşitli veri kümelerinde iyi performans gösterir; ancak AdaBoost'un gürültülü veri setlerinde iyi performans göstermediği gösterilebilir.^[2] Bu, AdaBoost'un defalarca yanlış sınıflandırılan örneklere odaklanmasının bir sonucudur. Bunun aksine, BrownBoost defalarca yanlış sınıflandırılan örneklerden etkin bir şekilde "vazgeçer". BrownBoost'un temel varsayımı, gürültülü örneklerin tekrar tekrar zayıf hipotezlerle yanlış etiketleneceği ve gürültülü olmayan örneklerin "vazgeçilmeyecek" kadar sık sık doğru etiketleneceği yönündedir. Bu nedenle, yalnızca gürültülü örnekler "vazgeçilir", gürültülü olmayan örnekler ise son sınıflandırıcıya katkıda bulunur. Buna karşılık, son sınıflandırıcı gürültülü olmayan örneklerden öğrenilirse, genelleme hatası son sınıflandırıcı, gürültülü ve gürültülü olmayan örneklerden öğrenildiğinden çok daha iyi olabilir.

Algoritmanın kullanıcısı, eğitim setinde tolere edilecek hata miktarını belirleyebilir. Bu nedenle, eğitim seti gürültülü ise (örneğin tüm örneklerin% 10'unun yanlış etiketlendiği varsayılır), güçlendiriciye% 10 hata oranını kabul etmesi söylenebilir. Gürültülü örnekler göz ardı edilebileceğinden, yalnızca gerçek örnekler öğrenme sürecine katkıda bulunacaktır.

Algoritma açıklaması

BrownBoost, dışbükey olmayan bir potansiyel kayıp işlevi kullanır, bu nedenle AdaBoost çerçeve. Dışbükey olmayan optimizasyon, gürültülü veri kümelerinin aşırı uyumunu önlemek için bir yöntem sağlar. Bununla birlikte, analitik olarak bir dışbükey kayıp işlevini (ör. AdaBoost ve LogitBoost ), BrownBoost standart sayısal yöntemler kullanarak iki denklem ve iki bilinmeyenli bir sistemi çözer.

BrownBoost'un tek parametresi ( ${displaystyle c}$ algoritmada), algoritmanın çalıştırdığı "zamandır". BrownBoost teorisi, her hipotezin değişken bir süre aldığını belirtir ( ${displaystyle t}$ Algoritmada) hipoteze verilen ağırlık ile doğrudan ilgilidir ${displaystyle alpha}$ . BrownBoost'taki zaman parametresi, yineleme sayısına benzer ${displaystyle T}$ AdaBoost'ta.

Daha büyük bir değer ${displaystyle c}$ BrownBoost'un verileri daha az gürültülü gibi ele alacağı ve bu nedenle daha az örnekten vazgeçeceği anlamına gelir. Tersine, daha küçük bir değer ${displaystyle c}$ BrownBoost'un verileri daha gürültülü olarak ele alacağı ve daha fazla örnekten vazgeçeceği anlamına gelir.

Algoritmanın her yinelemesi sırasında, rastgele tahmin etmeye göre bir avantaja sahip bir hipotez seçilir. Bu hipotezin ağırlığı ${displaystyle alpha}$ ve "geçen süre" ${displaystyle t}$ yineleme sırasında, iki bilinmeyenli (hipotezin ağırlığı) iki doğrusal olmayan denklem sisteminde (1. örnek ağırlıklarla ilişkisiz hipotez ve 2. potansiyel sabit tutulur) aynı anda çözülür. ${displaystyle alpha}$ ve zaman geçti ${displaystyle t}$ ). Bu, ikiye bölme ile çözülebilir ( JBoost yazılım paketi) veya Newton yöntemi (Freund'un orijinal belgesinde anlatıldığı gibi). Bu denklemler çözüldüğünde, her örneğin kenar boşlukları ( ${displaystyle r_ {i} (x_ {j})}$ algoritmada) ve kalan süre miktarı ${displaystyle s}$ uygun şekilde güncellenir. Bu işlem, zaman kalmayana kadar tekrar edilir.

Başlangıç potansiyeli şu şekilde tanımlanır: ${displaystyle {frac {1} {m}} toplam _ {j = 1} ^ {m} 1- {mbox {erf}} ({sqrt {c}}) = 1- {mbox {erf}} ({sqrt {c}})}$ . Her yinelemenin bir kısıtlaması, potansiyelin sabit tutulması olduğu için, son potansiyel ${displaystyle {frac {1} {m}} toplam _ {j = 1} ^ {m} 1- {mbox {erf}} (r_ {i} (x_ {j}) / {sqrt {c}}) = 1- {mbox {erf}} ({sqrt {c}})}$ . Böylece son hata muhtemelen Yakın olmak ${displaystyle 1- {mbox {erf}} ({sqrt {c}})}$ . Bununla birlikte, nihai potansiyel işlevi 0-1 kayıp hata işlevi değildir. Son hatanın tam olması için ${displaystyle 1- {mbox {erf}} ({sqrt {c}})}$ , kayıp fonksiyonunun varyansı doğrusal olarak azalmalıdır. yinelemeleri artırmanın sonunda 0-1 kayıp işlevini oluşturma zamanı. Bu, literatürde henüz tartışılmamıştır ve aşağıdaki algoritmanın tanımında yer almamaktadır.

Son sınıflandırıcı, zayıf hipotezlerin doğrusal bir kombinasyonudur ve diğer pek çok yükseltme algoritması ile aynı şekilde değerlendirilir.

BrownBoost öğrenme algoritması tanımı

Giriş:

${displaystyle m}$ eğitim örnekleri ${displaystyle (x_ {1}, y_ {1}), ldots, (x_ {m}, y_ {m})}$ nerede ${displaystyle x_ {j} X içinde ,, y_ {j} Y = {- 1, + 1}}$
Parametre ${displaystyle c}$

İlklendir:

${displaystyle s = c}$ . (Değeri ${displaystyle s}$ oyunda kalan süredir)
${displaystyle r_ {i} (x_ {j}) = 0}$ ${displaystyle forall j}$ . Değeri ${displaystyle r_ {i} (x_ {j})}$ yinelemedeki marj ${displaystyle i}$ Örneğin ${displaystyle x_ {j}}$ .

Süre ${ekran stili> 0}$ :

Her örneğin ağırlıklarını ayarlayın: ${displaystyle W_ {i} (x_ {j}) = e ^ {- {frac {(r_ {i} (x_ {j}) + s) ^ {2}} {c}}}}$ , nerede ${displaystyle r_ {i} (x_ {j})}$ örnek marjı ${displaystyle x_ {j}}$
Bir sınıflandırıcı bulun ${displaystyle h_ {i}: X o {-1, + 1}}$ öyle ki ${displaystyle toplamı _ {j} W_ {i} (x_ {j}) h_ {i} (x_ {j}) y_ {j}> 0}$
Değerleri bulun ${displaystyle alpha, t}$ denklemi sağlayan:
${displaystyle toplamı _ {j} h_ {i} (x_ {j}) y_ {j} e ^ {- {frac {(r_ {i} (x_ {j}) + alfa h_ {i} (x_ {j} ) y_ {j} + st) ^ {2}} {c}}} = 0}$ .
(Bunun duruma benzer olduğunu unutmayın ${displaystyle E_ {W_ {i + 1}} [h_ {i} (x_ {j}) y_ {j}] = 0}$ Schapire ve Singer tarafından ortaya konmuştur.^[3] Bu ortamda, sayısal olarak buluyoruz ${displaystyle W_ {i + 1} = exp sol ({frac {cdots} {cdots}} ight)}$ öyle ki ${displaystyle E_ {W_ {i + 1}} [h_ {i} (x_ {j}) y_ {j}] = 0}$ .)
Bu güncelleme kısıtlamaya tabidir
${displaystyle toplamı sol (Phi sol (r_ {i} (x_ {j}) + alfa h (x_ {j}) y_ {j} + s-sıkı) -Phi sol (r_ {i} (x_ {j}) + görüş) ight) = 0}$ ,
nerede ${displaystyle Phi (z) = 1- {mbox {erf}} (z / {sqrt {c}})}$ marjlı bir puan için potansiyel kayıp ${displaystyle r_ {i} (x_ {j})}$
Her örnek için kenar boşluklarını güncelleyin: ${displaystyle r_ {i + 1} (x_ {j}) = r_ {i} (x_ {j}) + alfa h (x_ {j}) y_ {j}}$
Kalan süreyi güncelleyin: ${displaystyle s = s-t}$

Çıktı: ${displaystyle H (x) = {extrm {işaret}} sol (toplam _ {i} alfa _ {i} h_ {i} (x) ight)}$

Ampirik sonuçlar

Gürültülü veri kümelerine sahip ön deneysel sonuçlarda BrownBoost daha iyi performans gösterdi AdaBoost genelleme hatası; ancak, LogitBoost BrownBoost'un yanı sıra gerçekleştirildi.^[4] BrownBoost'un bir uygulaması açık kaynak yazılımda bulunabilir JBoost.

Referanslar

^ Yoav Freund. Çoğunluk algoritmasıyla güçlendirmenin uyarlanabilir bir versiyonu. Makine Öğrenimi, 43 (3): 293-318, Haziran 2001.
^ Dietterich, T. G., (2000). Karar ağaçları toplulukları oluşturmak için üç yöntemin deneysel karşılaştırması: Torbalama, güçlendirme ve randomizasyon. Makine Öğrenimi, 40 (2) 139-158.
^ Robert Schapire ve Yoram Singer. Güven Dereceli Tahminler Kullanarak Geliştirilmiş Artırma. Makine Öğrenimi Dergisi, Cilt 37 (3), sayfalar 297-336. 1999
^ Ross A. McDonald, David J. El, Idris A. Eckley. Yapay Sınıf Gürültülü Gerçek Veri Kümelerinde Üç Yükseltme Algoritmasının Ampirik Bir Karşılaştırması. Çoklu Sınıflandırıcı Sistemler, Bilgisayar Bilimi Serilerinde Ders Notları, sayfalar 35-44, 2003.

Ayrıca bakınız

[Freund01-1] Yoav Freund. Çoğunluk algoritmasıyla güçlendirmenin uyarlanabilir bir versiyonu. Makine Öğrenimi, 43 (3): 293-318, Haziran 2001.

[Dietterich00-2] Dietterich, T. G., (2000). Karar ağaçları toplulukları oluşturmak için üç yöntemin deneysel karşılaştırması: Torbalama, güçlendirme ve randomizasyon. Makine Öğrenimi, 40 (2) 139-158.

[Schapire99-3] Robert Schapire ve Yoram Singer. Güven Dereceli Tahminler Kullanarak Geliştirilmiş Artırma. Makine Öğrenimi Dergisi, Cilt 37 (3), sayfalar 297-336. 1999

[McDonald03-4] Ross A. McDonald, David J. El, Idris A. Eckley. Yapay Sınıf Gürültülü Gerçek Veri Kümelerinde Üç Yükseltme Algoritmasının Ampirik Bir Karşılaştırması. Çoklu Sınıflandırıcı Sistemler, Bilgisayar Bilimi Serilerinde Ders Notları, sayfalar 35-44, 2003.

[1]

[2]

[3]

[4]