Manifold düzenlenmesi - Manifold regularization

Manifold düzenleme, etiketli veriler (siyah ve beyaz daireler) seyrek olduğunda, etiketlenmemiş verilerden (gri daireler) yararlanarak verileri sınıflandırabilir. Birçok etiketli veri noktası olmadan, denetimli öğrenme algoritmalar yalnızca çok basit karar sınırlarını öğrenebilir (üst panel). Manifold öğrenme, birbirine yakın noktaların muhtemelen aynı sınıfa ait olduğu varsayımı altında, etiketlenmemiş verilerin doğal sınıfları arasında bir karar sınırı çizebilir ve bu nedenle karar sınırı, birçok etiketlenmemiş noktaya sahip alanlardan kaçınmalıdır. Bu bir sürümüdür yarı denetimli öğrenme.

İçinde makine öğrenme, Manifold düzenlenmesi o veri setinde öğrenilmesi gereken fonksiyonları kısıtlamak için bir veri setinin şeklini kullanma tekniğidir. Pek çok makine öğrenimi probleminde öğrenilecek veriler tüm girdi alanını kapsamaz. Örneğin, bir yüz tanıma sistemi olası herhangi bir görüntüyü sınıflandırmanız gerekmeyebilir, ancak yalnızca yüz içeren görüntü alt kümesini sınıflandırmanız gerekebilir. Çoklu öğrenme tekniği, ilgili veri alt kümesinin bir manifold, kullanışlı özelliklere sahip matematiksel bir yapı. Teknik ayrıca öğrenilecek fonksiyonun olduğunu varsayar. pürüzsüz: Farklı etiketlere sahip verilerin birbirine yakın olması muhtemel değildir ve bu nedenle, birçok veri noktasının olduğu alanlarda etiketleme işlevi hızlı bir şekilde değişmemelidir. Bu varsayım nedeniyle, bir manifold düzenleme algoritması, öğrenilen fonksiyonun nerede hızlı bir şekilde değişmesine izin verildiğini ve nerede olmadığını bildirmek için, tekniğin bir uzantısını kullanarak etiketlenmemiş verileri kullanabilir. Tikhonov düzenlenmesi. Manifold düzenleme algoritmaları genişletilebilir denetimli öğrenme içindeki algoritmalar yarı denetimli öğrenme ve transdüktif öğrenme etiketlenmemiş verilerin mevcut olduğu ayarlar. Teknik, tıbbi görüntüleme, coğrafi görüntüleme ve nesne tanıma gibi uygulamalar için kullanılmıştır.

Manifold düzenleyici

Motivasyon

Manifold düzenlenmesi bir tür düzenleme, azaltan teknikler ailesi aşırı uyum gösterme ve bir sorunun iyi pozlanmış karmaşık çözümleri cezalandırarak. Özellikle, manifold düzenlenmesi, tekniğini genişletir. Tikhonov düzenlenmesi uygulandığı gibi Çekirdek Hilbert uzaylarını çoğaltma (RKHS'ler). RKHS'lerde standart Tikhonov düzenlemesi altında, bir öğrenme algoritması bir işlevi öğrenmeye çalışır fonksiyonların bir hipotez uzayından . Hipotez alanı bir RKHS'dir, yani bir çekirdek ve böylece her aday işlev var norm , hipotez uzayındaki aday işlevin karmaşıklığını temsil eder. Algoritma, bir aday işlevi değerlendirdiğinde, karmaşık işlevleri cezalandırmak için normunu dikkate alır.

Resmi olarak, bir dizi etiketli eğitim verisi verildiğinde ile ve bir kayıp fonksiyonu , Tikhonov düzenlileştirmesini kullanan bir öğrenme algoritması, ifadeyi çözmeye çalışacaktır

nerede bir hiperparametre Bu, algoritmanın verilere daha iyi uyan işlevlere daha basit işlevleri ne kadar tercih edeceğini kontrol eder.

İki boyutlu manifold üç boyutlu alana gömülü (sol üst). Manifold düzenlileştirme, açılan manifoldda (sağ üstte) düzgün olan bir işlevi öğrenmeye çalışır.

Manifold düzenlileştirme, ikinci bir düzenlileştirme terimi ekler, iç düzenleyici, için ortam düzenleyici standart Tikhonov regülasyonunda kullanılır. Altında manifold varsayımı makine öğreniminde, söz konusu veriler tüm giriş alanından gelmez , ancak bunun yerine doğrusal olmayan bir manifold . Bu manifoldun geometrisi, iç uzay, düzenlilik normunu belirlemek için kullanılır.[1]

Laplacian normu

İçin birçok olası seçenek var . Birçok doğal seçim şunları içerir: manifold üzerindeki gradyan , hedef işlevin ne kadar düzgün olduğuna dair bir ölçü sağlayabilir. Girdi verilerinin yoğun olduğu yerlerde düzgün bir işlev yavaşça değişmelidir; yani gradyan küçük olmalı marjinal olasılık yoğunluğu , olasılık yoğunluğu rastgele çizilmiş bir veri noktasının , büyük. Bu, içsel düzenleyici için uygun bir seçim sağlar:

Uygulamada, bu norm doğrudan hesaplanamaz çünkü marjinal dağılım bilinmiyor, ancak sağlanan verilerden tahmin edilebilir. Özellikle, giriş noktaları arasındaki mesafeler bir grafik olarak yorumlanıyorsa, Laplacian matrisi grafiğin, marjinal dağılımın tahmin edilmesine yardımcı olabilir. Giriş verilerinin şunları içerdiğini varsayalım: etiketli örnekler (bir girişin çiftleri ve bir etiket ) ve etiketlenmemiş örnekler (ilişkili etiketleri olmayan girdiler). Tanımlamak bir grafik için kenar ağırlıkları matrisi olmak, veri noktaları arasındaki mesafe ölçüsüdür ve . Tanımlamak ile köşegen bir matris olmak ve Laplacian matrisi olmak . Ardından, veri noktalarının sayısı olarak artışlar, yakınsamak Laplace – Beltrami operatörü , hangisi uyuşmazlık gradyan .[2][3] O zaman eğer değerlerinin bir vektörü verilerde, iç norm tahmin edilebilir:

Veri noktalarının sayısı olarak artar, bu ampirik tanım tanıma yakınsadığı zaman bilinen.[1]

Düzenlilik sorununu çözme

Ağırlıkları kullanma ve ortam ve iç düzenleyiciler için çözülecek son ifade şu olur:

Diğerlerinde olduğu gibi çekirdek yöntemleri, sonsuz boyutlu bir uzay olabilir, bu nedenle düzenlileştirme ifadesi açıkça çözülemezse, bir çözüm için tüm alanı aramak imkansızdır. Bunun yerine, bir temsilci teoremi norm seçiminde belirli koşullar altında en uygun çözüm giriş noktalarının her birinde merkezlenmiş çekirdeğin doğrusal bir kombinasyonu olmalıdır: bazı ağırlıklar için ,

Bu sonucu kullanarak en uygun çözümü aramak mümkündür. olası seçimlerle tanımlanan sonlu boyutlu uzay arayarak .[1]

Başvurular

Manifold regülasyonu, uygun bir kayıp fonksiyonu seçerek Tikhonov regülasyonunu kullanarak ifade edilebilen çeşitli algoritmaları genişletebilir. ve hipotez alanı . Yaygın olarak kullanılan iki örnek, Vektör makineleri desteklemek ve düzenlenmiş en küçük kareler algoritmalar. (Düzenlenmiş en küçük kareler, sırt regresyon algoritmasını; LASSO'nun ilgili algoritmalarını ve elastik ağ düzenlenmesi destek vektör makineleri olarak ifade edilebilir.[4][5]Bu algoritmaların genişletilmiş sürümleri, sırasıyla Laplacian Regularized En Küçük Kareler (kısaltılmış LapRLS) ve Laplacian Destek Vektör Makineleri (LapSVM) olarak adlandırılır.[1]

Laplacian Düzenlenmiş En Küçük Kareler (LapRLS)

Düzenlenmiş en küçük kareler (RLS), bir regresyon algoritmaları: bir değeri tahmin eden algoritmalar girdileri için , tahmin edilen değerlerin veriler için gerçek etiketlere yakın olması hedefiyle. Özellikle, RLS, ortalama karesel hata normalleştirmeye tabi olarak tahmin edilen değerler ve gerçek etiketler arasında. Ridge regresyonu, RLS'nin bir şeklidir; genel olarak RLS, sırt regresyonu ile aynıdır. çekirdek yöntemi.[kaynak belirtilmeli ] RLS için sorun ifadesi, kayıp işlevinin seçilmesinden kaynaklanır Tikhonov regülasyonunda ortalama hata karesi olacak şekilde düzenlenir:

Sayesinde temsilci teoremi çözüm, veri noktalarında değerlendirilen çekirdeğin ağırlıklı toplamı olarak yazılabilir:

ve çözmek için verir:

nerede çekirdek matrisi olarak tanımlanır, , ve veri etiketlerinin vektörüdür.

Manifold düzenlenmesi için bir Laplacian terimi eklemek Laplacian RLS ifadesini verir:

Manifold düzenlileştirme için temsilci teoremi tekrar verir

ve bu, vektör için bir ifade verir . İzin vermek yukarıdaki gibi çekirdek matrisi olun, veri etiketlerinin vektörü ve ol blok matrisi :

bir çözümle

[1]

LapRLS sensör ağları dahil sorunlara uygulanmıştır,[6]tıbbi Görüntüleme,[7][8]nesne algılama,[9]spektroskopi,[10]belge sınıflandırması,[11]ilaç-protein etkileşimleri,[12]ve görüntüleri ve videoları sıkıştırmak.[13]

Laplacian Destek Vektör Makineleri (LapSVM)

Vektör makineleri desteklemek (SVM'ler) genellikle aşağıdakiler için kullanılan bir algoritma ailesidir: verileri sınıflandırmak iki veya daha fazla gruba veya sınıflar. Sezgisel olarak, bir SVM, sınıra en yakın etiketli örnekler mümkün olduğunca uzakta olacak şekilde sınıflar arasında bir sınır çizer. Bu doğrudan şu şekilde ifade edilebilir: doğrusal program, ancak aynı zamanda Tikhonov'un menteşe kaybı fonksiyon :

[14][15]

Bu ifadeye içsel düzenleme terimini eklemek LapSVM problem ifadesini verir:

Yine, temsilci teoremi, çözümün veri noktalarında değerlendirilen çekirdek cinsinden ifade edilmesine izin verir:

problemi doğrusal bir program olarak yazıp çözerek bulunabilir ikili problem. Yine izin veriyorum çekirdek matrisi olun ve blok matrisi ol çözüm olarak gösterilebilir

nerede ikili sorunun çözümü

ve tarafından tanımlanır

[1]

Coğrafi görüntüleme dahil sorunlara LapSVM uygulanmıştır,[16][17][18]tıbbi Görüntüleme,[19][20][21]yüz tanıma,[22]makine bakımı,[23]ve beyin-bilgisayar arayüzleri.[24]

Sınırlamalar

  • Manifold düzenleme, farklı etiketlere sahip verilerin birbirine yakın olma olasılığının düşük olduğunu varsayar. Bu varsayım, tekniğin etiketlenmemiş verilerden bilgi çekmesine izin veren şeydir, ancak yalnızca bazı sorun alanları için geçerlidir. Verinin yapısına bağlı olarak, farklı bir yarı denetimli veya dönüştürücü öğrenme algoritması kullanmak gerekli olabilir.[25]
  • Bazı veri kümelerinde, bir fonksiyonun iç normu ortam normuna çok yakın olabilir : örneğin, veriler dikey çizgiler üzerinde uzanan iki sınıftan oluşuyorsa, iç norm ortam normuna eşit olacaktır. Bu durumda, veriler algoritmanın ayırıcının düzgün olması gerektiği varsayımına uysa bile, etiketlenmemiş verilerin, manifold düzenlenmesi ile öğrenilen çözüm üzerinde hiçbir etkisi yoktur. İle ilgili yaklaşımlar ortak eğitim bu sınırlamayı ele almak için önerilmiştir.[26]
  • Çok fazla sayıda etiketlenmemiş örnek varsa, çekirdek matrisi çok büyük hale gelir ve bir manifold düzenlileştirme algoritması, hesaplamak için engelleyici bir şekilde yavaşlayabilir. Çevrimiçi algoritmalar ve manifoldun seyrek yaklaşımları bu durumda yardımcı olabilir.[27]

Yazılım

Ayrıca bakınız

Referanslar

  1. ^ a b c d e f Belkin, Mikhail; Niyogi, Partha; Sindhwani, Vikas (2006). "Manifold düzenlileştirme: Etiketli ve etiketlenmemiş örneklerden öğrenmek için geometrik bir çerçeve". Makine Öğrenimi Araştırmaları Dergisi. 7: 2399–2434. Alındı 2015-12-02.
  2. ^ Hein, Matthias; Audibert, Jean-Yves; Von Luxburg, Ulrike (2005). "Grafiklerden manifoldlara - grafik laplaciansların zayıf ve güçlü noktasal tutarlılığı". Öğrenme teorisi. Bilgisayar Bilimlerinde Ders Notları. 3559. Springer. sayfa 470–485. CiteSeerX  10.1.1.103.82. doi:10.1007/11503415_32. ISBN  978-3-540-26556-6.
  3. ^ Belkin, Mikhail; Niyogi, Partha (2005). "Laplacian tabanlı manifold yöntemleri için teorik bir temele doğru". Öğrenme teorisi. Bilgisayar Bilimlerinde Ders Notları. 3559. Springer. sayfa 486–500. CiteSeerX  10.1.1.127.795. doi:10.1007/11503415_33. ISBN  978-3-540-26556-6.
  4. ^ Jaggi Martin (2014). Suykens, Johan; Signoretto, Marco; Argyriou, Andreas (ed.). Kement ve Destek Vektör Makineleri Arasındaki Eşdeğerlik. Chapman ve Hall / CRC.
  5. ^ Zhou, Quan; Chen, Wenlin; Şarkı, Shiji; Gardner, Jacob; Weinberger, Kilian; Chen, Yixin. Bir GPU Hesaplama Uygulamasıyla Vektör Makinelerini Desteklemek İçin Elastik Ağın Azaltılması. Yapay Zekayı Geliştirme Derneği.
  6. ^ Pan, Jeffrey Junfeng; Yang, Qiang; Chang, Hong; Yeung, Dit-Yan (2006). "Sensör ağı tabanlı izleme için kalibrasyonu azaltmaya yönelik bir manifold düzenleme yaklaşımı" (PDF). Ulusal yapay zeka konferansı bildirileri. 21. Menlo Park, CA; Cambridge, MA; Londra; AAAI Press; MIT Press; 1999. s. 988. Alındı 2015-12-02.
  7. ^ Zhang, Daoqiang; Shen Dinggang (2011). "Alzheimer hastalığının yarı denetimli multimodal sınıflandırması". Biyomedikal Görüntüleme: Nano'dan Makro'ya, 2011 IEEE Uluslararası Sempozyumu. IEEE. sayfa 1628–1631. doi:10.1109 / ISBI.2011.5872715.
  8. ^ Park, Sang Hyun; Gao, Yaozong; Shi, Yinghuan; Shen Dinggang (2014). "Uyarlanabilir Özellik Seçimi ve Manifold Düzenlemesine Dayalı Etkileşimli Prostat Segmentasyonu". Tıbbi Görüntülemede Makine Öğrenimi. Bilgisayar Bilimlerinde Ders Notları. 8679. Springer. s. 264–271. doi:10.1007/978-3-319-10581-9_33. ISBN  978-3-319-10580-2.
  9. ^ Pillai, Sudeep. "Yarı Denetimli Nesne Dedektörü Minimal Etiketlerden Öğreniyor" (PDF). Alındı 2015-12-15. Alıntı dergisi gerektirir | günlük = (Yardım)
  10. ^ Wan, Songjing; Wu, Di; Liu, Kangsheng (2012). "Yakın Kızılötesi Spektral Kalibrasyonda Yarı Denetimli Makine Öğrenimi Algoritması: Dizel Yakıtlar Üzerine Bir Örnek Çalışma". İleri Bilim Mektupları. 11 (1): 416–419. doi:10.1166 / asl.2012.3044.
  11. ^ Wang, Ziqiang; Sun, Xia; Zhang, Lijie; Qian, Xu (2013). "Optimal Laprls'e göre Belge Sınıflandırması". Yazılım Dergisi. 8 (4): 1011–1018. doi:10.4304 / jsw.8.4.1011-1018.
  12. ^ Xia, Zheng; Wu, Ling-Yun; Zhou, Xiaobo; Wong, Stephen TC (2010). "Heterojen biyolojik alanlardan yarı denetimli ilaç-protein etkileşimi tahmini". BMC Sistemleri Biyolojisi. 4 (Ek 2): –6. CiteSeerX  10.1.1.349.7173. doi:10.1186 / 1752-0509-4-S2-S6. PMC  2982693. PMID  20840733.
  13. ^ Cheng, Li; Vishwanathan, S. V.N. (2007). "Resimleri ve videoları sıkıştırmayı öğrenme". 24. Uluslararası Makine Öğrenimi Konferansı Bildirileri. ACM. s. 161–168. Alındı 2015-12-16.
  14. ^ Lin, Yi; Wahba, Grace; Zhang, Hao; Lee, Yoonkyung (2002). "Destek vektör makinelerinin istatistiksel özellikleri ve uyarlanabilir ayarı". Makine öğrenme. 48 (1–3): 115–136. doi:10.1023 / A: 1013951620650.
  15. ^ Wahba, Grace; diğerleri (1999). "Vektör makinelerini destekleyin, çekirdek Hilbert uzaylarını ve randomize GACV'yi yeniden üretin". Çekirdek Yöntemlerindeki Gelişmeler-Vektör Öğrenmeyi Destekler. 6: 69–87. CiteSeerX  10.1.1.53.2114.
  16. ^ Kim, Wonkook; Crawford, Melba M. (2010). "Manifold düzenlileştirme çekirdek makineleri kullanarak hiperspektral görüntü verileri için uyarlanabilir sınıflandırma". Yerbilimi ve Uzaktan Algılama Üzerine IEEE İşlemleri. 48 (11): 4110–4121. doi:10.1109 / TGRS.2010.2076287. S2CID  29580629.
  17. ^ Camps-Valls, Gustavo; Tuia, Devis; Bruzzone, Lorenzo; Atli Benediktsson, Jon (2014). "Hiperspektral görüntü sınıflandırmasındaki gelişmeler: İstatistiksel öğrenme yöntemleriyle Dünya izleme". IEEE Sinyal İşleme Dergisi. 31 (1): 45–54. arXiv:1310.5107. Bibcode:2014ISPM ... 31 ... 45C. doi:10.1109 / msp.2013.2279179. S2CID  11945705.
  18. ^ Gómez-Chova, Luis; Camps-Valls, Gustavo; Munoz-Marí, Jordi; Calpe, Javier (2007). "Laplacian SVM ile yarı denetimli bulut taraması". Yerbilimi ve Uzaktan Algılama Sempozyumu, 2007. IGARSS 2007. IEEE International. IEEE. s. 1521–1524. doi:10.1109 / IGARSS.2007.4423098.
  19. ^ Cheng, Bo; Zhang, Daoqiang; Shen Dinggang (2012). "MCI dönüşüm tahmini için alan aktarımı öğrenme". Tıbbi Görüntü Hesaplama ve Bilgisayar Destekli Müdahale - MICCAI 2012. Bilgisayar Bilimlerinde Ders Notları. 7510. Springer. sayfa 82–90. doi:10.1007/978-3-642-33415-3_11. ISBN  978-3-642-33414-6. PMC  3761352. PMID  23285538.
  20. ^ Jamieson, Andrew R .; Giger, Maryellen L .; Drukker, Karen; Pesce, Lorenzo L. (2010). "Etiketlenmemiş verilerle göğüs CADx'inin geliştirilmesia)". Tıp fiziği. 37 (8): 4155–4172. Bibcode:2010MedPh..37.4155J. doi:10.1118/1.3455704. PMC  2921421. PMID  20879576.
  21. ^ Wu, Jiang; Diao, Yuan-Bo; Li, Meng-Long; Fang, Ya-Ping; Ma, Dai-Chuan (2009). "Yarı denetimli öğrenmeye dayalı bir yöntem: Diyabet hastalığı tanısında kullanılan Laplacian destek vektör makinesi". Disiplinlerarası Bilimler: Hesaplamalı Yaşam Bilimleri. 1 (2): 151–155. doi:10.1007 / s12539-009-0016-2. PMID  20640829. S2CID  21860700.
  22. ^ Wang, Ziqiang; Zhou, Zhiqiang; Sun, Xia; Qian, Xu; Güneş, Lijun (2012). "Yüz Tanıma için Gelişmiş LapSVM Algoritması". International Journal of Advancements in Computing Technology. 4 (17). Alındı 2015-12-16.
  23. ^ Zhao, Xiukuan; Li, Min; Xu, Jinwu; Şarkı, Gangbing (2011). "İzleme sistemi oluşturmak için etiketlenmemiş verileri kullanan etkili bir prosedür". Uygulamalarla uzmanlık sistmeleri. 38 (8): 10199–10204. doi:10.1016 / j.eswa.2011.02.078.
  24. ^ Zhong, Ji-Ying; Lei, Xu; Yao, D. (2009). "BCI'daki manifolda dayalı yarı denetimli öğrenme" (PDF). Çin Elektronik Bilimi ve Teknolojisi Dergisi. 7 (1): 22–26. Alındı 2015-12-16.
  25. ^ Zhu Xiaojin (2005). "Yarı denetimli öğrenme literatürü araştırması". CiteSeerX  10.1.1.99.9681. Alıntı dergisi gerektirir | günlük = (Yardım)
  26. ^ Sindhwani, Vikas; Rosenberg, David S. (2008). "Çok görüntülü öğrenme ve çok katlı ortak düzenleme için bir RKHS". 25. Uluslararası Makine Öğrenimi Konferansı Bildirileri. ACM. s. 976–983. Alındı 2015-12-02.
  27. ^ Goldberg, Andrew; Li, Ming; Zhu, Xiaojin (2008). Çevrimiçi manifold düzenlenmesi: Yeni bir öğrenme ortamı ve ampirik çalışma. Veritabanlarında Makine Öğrenimi ve Bilgi Keşfi. Bilgisayar Bilimlerinde Ders Notları. 5211. s. 393–407. doi:10.1007/978-3-540-87479-9_44. ISBN  978-3-540-87478-2.