Etki alanı uyarlaması - Domain adaptation

Normal makine öğrenimi ayarı ile aktarım öğrenimi arasındaki ayrım ve alan uyarlamasının konumlandırılması.

Etki alanı uyarlaması[1][2][3] ile ilişkili bir alandır makine öğrenme ve transfer öğrenimi. Bu senaryo, bir kaynak veri dağıtımından farklı (ancak ilişkili) bir hedef veri dağıtımında iyi performans gösteren bir model öğrenmeyi hedeflediğimizde ortaya çıkar. Örneğin, ortak görevlerden biri spam filtreleme sorunu modeli, bir kullanıcıdan (kaynak dağıtımı) önemli ölçüde farklı e-postalar alan (hedef dağıtım) yeni bir kullanıcıya uyarlamaktan oluşur. Alan adaptasyonunun ilgisiz kaynakları öğrenmek için de faydalı olduğu görülmüştür.[4]Birden fazla kaynak dağıtımı mevcut olduğunda, soruna çok kaynaklı etki alanı uyarlaması denildiğini unutmayın.[5]

Genel Bakış

Etki alanı uyarlaması, bir veya daha fazla "kaynak etki alanında" eğitilmiş bir algoritmayı farklı (ancak ilişkili) bir "hedef etki alanına" uygulama yeteneğidir. Etki alanı uyarlaması, aktarım öğrenmenin bir alt kategorisidir. Etki alanı uyarlamasında, kaynak ve hedef etki alanlarının tümü aynıdır özellik alanı (ancak farklı dağılımlar); bunun tersine, transfer öğrenimi, hedef alanın özellik alanının kaynak özellik alanı veya alanlarından farklı olduğu durumları içerir.[6]

Etki alanı kayması

Bir alan kayması,[7] veya dağılım kayması,[8] bir algoritmanın eğitim veri kümesi ile dağıtıldığında karşılaştığı bir veri kümesi arasındaki veri dağılımındaki bir değişikliktir. Bu alan kaymaları, yapay zekanın pratik uygulamalarında yaygındır. Geleneksel makine öğrenimi algoritmaları genellikle alan kaymalarına yetersiz uyum sağlar. Modern makine öğrenimi topluluğu, daha iyi etki alanı uyarlaması elde etmeye çalışmak için birçok farklı stratejiye sahiptir.[7]

Örnekler

  • Haber kaynakları üzerine eğitilmiş bir algoritmanın yeni bir biyomedikal veri setine adapte olması gerekebilir.[9]
  • Eğitim sırasında belirli bir e-posta kullanıcısı grubu üzerinde eğitilen bir spam filtresi, konuşlandırıldığında yeni bir hedef kullanıcıya uyum sağlamalıdır.[10]
  • Önceki hastalıklarla ilişkili etiketli veriler üzerinde eğitilmiş yapay zeka teşhis algoritmalarının, ilgili yeni etiketlenmemiş verilere uygulanması Kovid-19 pandemisi.[11]
  • Pandemik salgın gibi ani bir toplumsal değişim, alan kayması oluşturabilir ve artık eskimiş tüketici verileri üzerinde eğitilmiş makine öğrenimi algoritmalarının başarısız olmasına ve müdahale gerektirmesine neden olabilir.[12][13]

Diğer uygulamalar arasında wifi yerelleştirme algılama ve Bilgisayar görüşü.[6]

Resmileştirme

İzin Vermek girdi alanı (veya açıklama alanı) ve izin ver çıktı alanı (veya etiket alanı) olabilir. Bir makine öğrenimi algoritmasının amacı matematiksel bir model (bir hipotez) öğrenmektir. bir etiket eklenebilir bir örneğe . Bu model bir öğrenme örneğinden öğrenilir .

Genellikle içinde denetimli öğrenme (alan uyarlaması olmadan), örneklerin çizilmiş i.i.d. bir dağıtımdan destek (bilinmeyen ve sabit). Amaç daha sonra öğrenmektir (kimden ) dağıtımdan gelen yeni örnekleri etiketlemede mümkün olan en az hatayı yapacak şekilde .

Denetimli öğrenme ile alan uyarlaması arasındaki temel fark, ikinci durumda iki farklı (ancak ilişkili) dağılımı incelememizdir. ve açık [kaynak belirtilmeli ]. Alan uyarlama görevi daha sonra kaynak alandan bilgi aktarımından oluşur. hedef olana . Amaç daha sonra öğrenmektir (iki alandan gelen etiketli veya etiketsiz örneklerden), hedef alanda mümkün olduğunca az hata yapacak şekilde [kaynak belirtilmeli ].

Ana sorun şudur: Bir model bir kaynak alandan öğrenilirse, hedef alandan gelen verileri doğru şekilde etiketleme kapasitesi nedir?

Farklı alan uyarlama türleri

Etki alanı uyarlamasının birkaç bağlamı vardır. Hedef görev için dikkate alınan bilgilerde farklılık gösterirler.

  1. denetimsiz alan uyarlaması: öğrenme örneği, bir dizi etiketli kaynak örneği, bir dizi etiketlenmemiş kaynak örneği ve bir dizi etiketlenmemiş hedef örnek içerir.
  2. yarı denetimli alan uyarlaması: Bu durumda, "küçük" bir dizi etiketli hedef örneği de dikkate alıyoruz.
  3. denetimli alan uyarlaması: dikkate alınan tüm örneklerin etiketlenmesi gerekiyor.

Dört algoritmik ilke

Yeniden ağırlıklandırma algoritmaları

Amaç, kaynak etiketli numuneyi hedef numuneye "benzeyecek" şekilde yeniden ağırlıklandırmaktır (dikkate alınan hata ölçüsü açısından).[14][15]

Yinelemeli algoritmalar

Bir uyarlama yöntemi, hedef örneklerin yinelemeli olarak "otomatik etiketlenmesinden" oluşur. Prensip basittir:

  1. Bir örnek etiketli örneklerden öğrenilir;
  2. bazı hedef örnekleri otomatik olarak etiketler;
  3. yeni etiketli örneklerden yeni bir model öğrenilir.

Başka yinelemeli yaklaşımların da olduğunu unutmayın, ancak genellikle hedef etiketli örneklere ihtiyaç duyarlar.[16][17]

Ortak bir temsil alanı arayışı

Amaç, iki alan için ortak bir temsil alanı bulmak veya inşa etmektir. Amaç, kaynak etiketleme görevinde iyi performanslar korurken, alanların birbirine yakın olduğu bir alan elde etmektir. Tartışmalı makine öğrenimi farklı alanlardaki örneklerden özellik temsillerinin ayırt edilemez olması teşvik edilen teknikler.[18][19]

Hiyerarşik Bayes Modeli

Amaç, Bayes hiyerarşik bir model oluşturmaktır. , esasen sayılar için bir çarpanlara ayırma modeli , hem alana özgü hem de küresel olarak paylaşılan gizli faktörlere izin veren etki alanına bağlı gizli temsilleri türetmek.[4]

Referanslar

  1. ^ Redko, Ievgen; Morvant, Emilie; Habrard, Amaury; Sebban, Marc; Bennani, Younès (2019). Etki Alanı Uyarlama Teorisindeki Gelişmeler. ISTE Basın - Elsevier. s. 187. ISBN  9781785482366.
  2. ^ Bridle, John S .; Cox, Stephen J (1990). "RecNorm: Eşzamanlı normalleştirme ve konuşma tanımaya uygulanan sınıflandırma" (PDF). Sinirsel Bilgi İşleme Sistemleri Konferansı (NIPS). s. 234–240.
  3. ^ Ben-David, Shai; Blitzer, John; Crammer, Koby; Kulesza, Alex; Pereira, Fernando; Wortman Vaughan, Jennifer (2010). "Farklı alanlardan öğrenme teorisi" (PDF). Makine öğrenme. 79 (1–2): 151–175. doi:10.1007 / s10994-009-5152-4.
  4. ^ a b Hajiramezanali, Ehsan; Siamak Zamani Dadaneh; Karbalayghareh, Alireza; Zhou, Mingyuan; Qian, Xiaoning (2018). "Yeni nesil dizileme sayım verilerinden kanser alt tipi keşfi için Bayes çok alanlı öğrenme". arXiv:1810.09433 [stat.ML ].
  5. ^ Crammer, Koby; Kearns, Michael; Wortman, Jeniifer (2008). "Çoklu Kaynaklardan Öğrenmek" (PDF). Makine Öğrenimi Araştırmaları Dergisi. 9: 1757–1774.
  6. ^ a b Sun, Shiliang; Shi, Honglei; Wu, Yuanbin (Temmuz 2015). "Çok kaynaklı etki alanı adaptasyonu araştırması". Bilgi Füzyonu. 24: 84–92. doi:10.1016 / j.inffus.2014.12.003.
  7. ^ a b Sun, Baochen, Jiashi Feng ve Kate Saenko. "Sinir bozucu derecede kolay alan adaptasyonunun geri dönüşü." Otuzuncu AAAI Yapay Zeka Konferansı'nda. 2016.
  8. ^ Amodei, Dario, Chris Olah, Jacob Steinhardt, Paul Christiano, John Schulman ve Dan Mané. "AI güvenliğinde somut sorunlar." arXiv ön baskı arXiv: 1606.06565 (2016).
  9. ^ Daumé III, Hal. "Sinir bozucu derecede kolay alan adaptasyonu." arXiv ön baskı arXiv: 0907.1815 (2009).
  10. ^ Ben-David, Shai, John Blitzer, Koby Crammer ve Fernando Pereira. "Alan adaptasyonu için temsillerin analizi." Nöral bilgi işleme sistemlerindeki gelişmeler, s. 137-144. 2007.
  11. ^ Hu, Yipeng; Jacob, Joseph; Parker, Geoffrey J. M .; Hawkes, David J .; Hurst, John R .; Stoyanov, Danail (Haziran 2020). "Hızla gelişen bir pandemide yapay zeka modellerini konuşlandırmanın zorlukları". Doğa Makine Zekası. 2 (6): 298–300. doi:10.1038 / s42256-020-0185-2. ISSN  2522-5839.
  12. ^ Matthews, Dylan (26 Mart 2019). "Yapay zeka felaketi Terminatör'e benzemeyecek. Daha ürkütücü olacak". Vox. Alındı 21 Haziran 2020.
  13. ^ "Pandemi sırasındaki tuhaf davranışımız, yapay zeka modelleriyle uğraşıyor". MIT Technology Review. 11 Mayıs 2020. Alındı 21 Haziran 2020.
  14. ^ Huang, Jiayuan; Smola, Alexander J .; Gretton, Arthur; Borgwardt, Karster M .; Schölkopf, Bernhard (2006). "Etiketlenmemiş Verilere Göre Örnek Seçim Sapmasını Düzeltme" (PDF). Sinirsel Bilgi İşleme Sistemleri Konferansı (NIPS). s. 601–608.
  15. ^ Shimodaira, Hidetoshi (2000). "Günlük olabilirlik fonksiyonunu ağırlıklandırarak ortak değişken kayması altında tahmine dayalı çıkarımı iyileştirme". İstatistiksel Planlama ve Çıkarım Dergisi. 90 (2): 227–244. doi:10.1016 / S0378-3758 (00) 00115-4.
  16. ^ Arief-Ang, I.B .; Salim, F.D .; Hamilton, M. (2017-11-08). DA-HOC: CO2 sensör verilerini kullanarak oda doluluk tahmini için yarı denetimli alan uyarlaması. 4. ACM Uluslararası Enerji Açısından Verimli Yerleşik Ortamlar için Sistemler Konferansı (BuildSys). Delft, Hollanda. s. 1–10. doi:10.1145/3137133.3137146. ISBN  978-1-4503-5544-5.
  17. ^ Arief-Ang, I.B .; Hamilton, M .; Salim, F.D. (2018-12-01). "CO2 Sensör Verilerinin Aktarılabilir Zaman Serileri Ayrıştırmasıyla Ölçeklenebilir Oda Doluluk Tahmini". Sensör Ağlarında ACM İşlemleri. 14 (3–4): 21:1–21:28. doi:10.1145/3217214.
  18. ^ Ganin, Yaroslav; Ustinova, Evgeniya; Ajakan, Hana; Germain, Pascal; Larochelle, Hugo; Laviolette, François; Marchand, Mario; Lempitsky, Victor (2016). "Sinir Ağlarının Etki Alanında Tartışmalı Eğitimi" (PDF). Makine Öğrenimi Araştırmaları Dergisi. 17: 1–35.
  19. ^ Hajiramezanali, Ehsan; Siamak Zamani Dadaneh; Karbalayghareh, Alireza; Zhou, Mingyuan; Qian, Xiaoning (2017). "Dış Mekan Robotiklerinde Dış Mekan Robotiklerinde Görünüş Değişimini Tartışmalı Alan Adaptasyonu ile Ele Alma". arXiv:1703.01461 [cs.RO ].