Öğrenme eğrisi (makine öğrenimi) - Learning curve (machine learning)

Eğitim puanı ve çapraz doğrulama puanını gösteren öğrenme eğrisi

İçinde makine öğrenme, bir öğrenme eğrisi (veya eğitim eğrisi) araziler en uygun bir modelin değeri kayıp fonksiyonu bu kayıp fonksiyonuna karşı bir eğitim seti için bir doğrulama Optimal işlevi üreten aynı parametrelerle veri seti. Bir makine modelinin daha fazla eğitim verisi eklemekten ne kadar fayda sağladığını ve tahmin edicinin varyans hatası mı yoksa sapma hatası mı daha fazla olduğunu bulmak için bir araçtır. Hem doğrulama puanı hem de eğitim puanı, eğitim setinin boyutu arttıkça çok düşük bir değere yaklaşırsa, daha fazla eğitim verisinden çok fazla faydalanmayacaktır.[1]

Makine öğrenme eğrisi, farklı algoritmaları karşılaştırmak da dahil olmak üzere birçok amaç için kullanışlıdır.[2] tasarım sırasında model parametrelerinin seçilmesi,[3] yakınsamayı iyileştirmek için optimizasyonu ayarlama ve eğitim için kullanılan veri miktarını belirleme.[4]

Makine öğrenimi alanında, modelin deneyiminin öğrenme için kullanılan eğitim örneklerinin sayısı veya modelin eğitiminde kullanılan yineleme sayısı olarak grafiğe dökülmesiyle, eğrilerin x ekseninde farklılık gösteren öğrenme eğrilerinin iki sonucu vardır.[5]

Resmi tanımlama

Makine öğreniminin bir modeli, bir işlevi, f (x), bazı bilgiler verilen, x, bazı değişkenleri tahmin eder, y, eğitim verilerinden ve . Farklıdır matematiksel optimizasyon Çünkü iyi tahmin etmeli dışında .

Genellikle olası işlevleri bir aile ile sınırlandırıyoruz böylece işlev genelleştirilebilir[6] ve böylece belirli özelliklerin doğru olması için, ya iyi bir daha kolay ya da bunların doğru olduğunu düşünmek için önsel bir nedenimiz olduğu için.[6]:172

Verilere mükemmel uyan bir işlevin üretilmesinin mümkün olmadığı göz önüne alındığında, bir kayıp işlevi üretmek gerekir. tahminimizin ne kadar iyi olduğunu ölçmek için. Daha sonra bir optimizasyon süreci tanımlarız. en aza indiren olarak anılır .

Veri miktarı için eğitim eğrisi

O zaman eğitim verilerimiz ve doğrulama verilerimiz bir öğrenme eğrisi, iki eğrinin grafiğidir

nerede

Çok sayıda yineleme için eğitim eğrisi

Birçok optimizasyon süreci yinelemelidir ve sürece kadar aynı adımı tekrar eder. yakınsak optimal bir değere. Dereceli alçalma böyle bir algoritmadır. Eğer tanımlarsan optimalin yaklaşımı olarak sonra adımlar, bir öğrenme eğrisi,

Ayrıca bakınız

Referanslar

  1. ^ scikit-learn geliştiricileri. "Doğrulama eğrileri: modelleri değerlendirmek için puanları çizme - scikit-learn 0.20.2 belgeleri". Alındı 15 Şubat 2019.
  2. ^ Madhavan, P.G. (1997). "Zaman Serisi Tahmini için Yeni Bir Tekrarlayan Sinir Ağı Öğrenme Algoritması" (PDF). Journal of Intelligent Systems. s. 113 fiekil 3.
  3. ^ "Makine Öğrenimi 102: Pratik Öneriler". Öğretici: Scikit-learn ile Astronomi için Makine Öğrenimi.
  4. ^ Meek, Christopher; Thiesson, Bo; Heckerman, David (Yaz 2002). "Model Tabanlı Kümelemeye Uygulanan Öğrenme Eğrisi Örnekleme Yöntemi". Makine Öğrenimi Araştırmaları Dergisi. 2 (3): 397. Arşivlenen orijinal 2013-07-15 tarihinde.
  5. ^ Sammut, Claude; Webb, Geoffrey I. (Ed.) (28 Mart 2011). Makine Öğrenimi Ansiklopedisi (1. baskı). Springer. s. 578. ISBN  978-0-387-30768-8.CS1 bakimi: ek metin: yazarlar listesi (bağlantı)
  6. ^ a b Goodfellow, Ian; Bengio, Yoshua; Courville, Aaron (2016-11-18). Derin Öğrenme. MIT Basın. s. 108. ISBN  978-0-262-03561-3.