Spline'ı yumuşatma - Smoothing spline

Spline'ları yumuşatmak fonksiyon tahminleridir, , bir dizi gürültülü gözlemden elde edildi hedefin , uyum iyiliği ölçüsünü dengelemek için -e türev tabanlı bir düzgünlük ölçüsü ile . Gürültüyü yumuşatmak için bir yol sağlarlar veri. En bilinen örnek, kübik yumuşatma eğrisidir, ancak başka birçok olasılık da vardır; bir vektör miktarıdır.

Kübik eğri tanımı

İzin Vermek ilişki tarafından modellenen bir gözlemler dizisi olmak nerede bağımsız, sıfır ortalama rasgele değişkenlerdir (genellikle sabit varyansa sahip olduğu varsayılır). Kübik yumuşatma spline tahmini fonksiyonun minimizer olarak tanımlanır (iki farklı türevlenebilir fonksiyon sınıfı üzerinden)[1][2]

Uyarılar:

  • , verilere uygunluk ve fonksiyon tahmininin pürüzlülüğü arasındaki değiş tokuşu kontrol eden bir yumuşatma parametresidir. Bu genellikle genelleştirilmiş çapraz doğrulama ile tahmin edilir,[3] veya spline yumuşatma ve Bayes kestirimi arasındaki bağlantıyı kullanan sınırlı marjinal olasılık (REML) ile (yumuşatma cezası, ).[4]
  • İntegral genellikle tüm gerçek çizgi üzerinden değerlendirilir, ancak aralığı aşağıdakilerle sınırlandırmak da mümkündür: .
  • Gibi (yumuşatma yok), pürüzsüzleştirici spline, enterpolasyonlu spline.
  • Gibi (sonsuz düzleştirme), pürüzlülük cezası en önemli hale gelir ve tahmin, bir doğrusal en küçük kareler tahmin.
  • Pürüzlülük cezası, ikinci türev modern istatistik literatüründe en yaygın olanıdır, ancak yöntem diğer türevlere dayalı cezalara kolayca uyarlanabilir.
  • Erken literatürde, eşit aralıklı sıralı cezada türevler yerine ikinci veya üçüncü dereceden farklılıklar kullanılmıştır.[5]
  • Düzeltme hedefi cezalandırılmış kareler toplamı, bir cezalandırılmış olasılık kareler terimlerinin toplamının başka bir log-olabilirlik temelli veriye uygunluk ölçüsü ile değiştirildiği amaç.[1] Karelerin toplamı terimi, cezalandırılmış olasılığa karşılık gelir ve Gauss varsayımı .

Kübik yumuşatma eğrisinin türetilmesi

Düzleştirici bir spline'ı iki adımda yerleştirmeyi düşünmek faydalıdır:

  1. İlk önce değerleri türetin .
  2. Bu değerlerden türetmek hepsi için x.

Şimdi, önce ikinci adımı tedavi edin.

Vektör verildiğinde uyan değerlerde, spline kriterinin kareler toplamı kısmı sabittir. Sadece küçültmek için kalır ve küçültücü doğal bir kübiktir eğri noktaları enterpolasyon yapan . Bu enterpolasyonlu eğri doğrusal bir operatördür ve şu şekilde yazılabilir:

nerede bir dizi spline temel işlevidir. Sonuç olarak, pürüzlülük cezası biçime sahiptir

unsurları nerede Bir vardır . Temel fonksiyonlar ve dolayısıyla matris Bir, tahmin değişkenlerinin konfigürasyonuna bağlıdır ama yanıtlarda değil veya .

Bir bir n×n tarafından verilen matris .

Δ bir (n-2)×n elementlerle ikinci farklılıkların matrisi:

, ,

W bir (n-2)×(n-2) elemanlı simetrik üç köşegen matris:

, ve , birbirini takip eden düğümler (veya x değerleri) arasındaki mesafeler.

Şimdi ilk adıma geri dönün. Cezalı kareler toplamı şu şekilde yazılabilir:

nerede .

Aşırı küçültme farklılaşarak . Bunun sonucu: [6] ve

De Boor'un yaklaşımı

De Boor'un yaklaşımı, düzgün bir eğriye sahip olmak ve verilen verilere yakın olmak arasında bir denge bulma fikrini kullanır.[7]

nerede yumuşak faktör adı verilen bir parametredir ve aralığa aittir , ve düzleştirmenin kapsamını kontrol eden miktarlardır (ağırlığı temsil ederler) her noktanın ). Uygulamada, kübik eğriler çoğunlukla kullanılır, genellikle . İçin çözüm Reinsch tarafından 1967'de önerildi.[8] İçin , ne zaman yaklaşımlar , verilen veriye "doğal" spline interpolantına yakınsar.[7] Gibi yaklaşımlar , düz bir çizgiye yakınsar (en yumuşak eğri). Uygun bir değer bulduğundan beri bir deneme yanılma görevidir, fazlalık bir sabittir kolaylık sağlamak için tanıtıldı.[8] değerini sayısal olarak belirlemek için kullanılır böylece işlev aşağıdaki koşulu karşılar:

De Boor tarafından açıklanan algoritma, ve artar koşul karşılanana kadar.[7] Eğer standart sapmanın bir tahminidir , sabit aralıkta seçilmesi tavsiye edilir . Sahip olmak çözümün "doğal" spline interpolantı olduğu anlamına gelir.[8] Artan verilen verilerden uzaklaşarak daha düzgün bir eğri elde ettiğimiz anlamına gelir.

Çok boyutlu spline'lar

Düzleştirmeden bir skalere göre genelleme yapmak için iki ana yöntem sınıfı vardır. bir vektöre göre yumuşatmak için . İlk yaklaşım basitçe spline yumuşatma cezasını çok boyutlu ayara genelleştirir. Örneğin, tahmin etmeye çalışıyorsanız kullanabiliriz İnce plaka eğri ceza ve bul küçültme

İnce plakalı spline yaklaşımı, ikiden fazla boyuta göre yumuşatma ve cezadaki diğer farklılaşma sıralarına göre genelleştirilebilir.[1] Boyut büyüdükçe, kullanılabilecek en küçük diferansiyel düzeninde bazı kısıtlamalar vardır,[1] ama aslında Duchon'un orijinal kağıdı,[9] bu kısıtlamayı önleyebilecek biraz daha karmaşık cezalar verir.

İnce plakalı spline'lar izotropiktir, yani döndürürsek koordinat sistemi, tahmin değişmeyecek, aynı zamanda aynı düzleştirme seviyesinin her yöne uygun olduğunu varsayıyoruz. Bu, uzamsal konuma göre düzleştirme yapılırken genellikle makul kabul edilir, ancak diğer birçok durumda izotropi uygun bir varsayım değildir ve görünüşte keyfi ölçüm birimi seçimlerine duyarlılığa yol açabilir. Örneğin, mesafe ve zaman açısından düzleştirme yapılıyorsa, izotropik pürüzsüzlük, mesafe metre cinsinden ölçülürse ve zaman saniye cinsinden ölçülürse, birimleri santimetre ve saat olarak değiştirirsek ne olacağına göre farklı sonuçlar verecektir.

Çok boyutlu yumuşatmaya yönelik ikinci sınıf genellemeler, tensör çarpım eğrisi yapılarını kullanan bu ölçek değişmezliği sorunuyla doğrudan ilgilenir.[10][11][12] Bu tür spline'lar, birden fazla yumuşatma parametresiyle yumuşatma cezalarına sahiptir; bu, aynı derecede pürüzsüzlüğün her yöne uygun olduğunu varsaymamak için ödenmesi gereken bedeldir.

İlgili yöntemler

Spline'lar şunlarla ilgilidir, ancak bunlardan farklıdır:

  • Regresyon eğrileri. Bu yöntemde, veriler, tipik olarak en küçük kareler olmak üzere azaltılmış bir düğüm kümesi ile bir dizi spline temel fonksiyonuna uydurulur. Pürüzlülük cezası uygulanmaz. (Ayrıca bakınız çok değişkenli adaptif regresyon eğrileri.)
  • Cezalı Spline'lar. Bu, gerileme spline'larının azaltılmış düğümlerini düzleştirme spline'larının pürüzlülük cezası ile birleştirir.[13][14]
  • Elastik haritalar yöntemi çok katlı öğrenme. Bu yöntem, en küçük kareler Yaklaşık manifoldun bükülme ve gerilme cezası ile yaklaşıklık hatası için ceza ve optimizasyon probleminin kaba ayrıklaştırmasını kullanır; görmek ince plaka spline'lar.

Kaynak kodu

İçin kaynak kodu eğri yumuşatma aşağıdaki örneklerde bulunabilir: Carl de Boor's kitap Spline'lar İçin Pratik Bir Kılavuz. Örnekler Fortran Programlama dili. Güncellenen kaynaklar Carl de Boor'un resmi sitesinde de mevcuttur [1].

Referanslar

  1. ^ a b c d Green, P. J .; Silverman, B.W. (1994). Parametrik Olmayan Regresyon ve Genelleştirilmiş Doğrusal Modeller: Bir pürüzlülük cezası yaklaşımı. Chapman ve Hall.
  2. ^ Hastie, T. J .; Tibshirani, R.J. (1990). Genelleştirilmiş Katkı Modelleri. Chapman ve Hall. ISBN  978-0-412-34390-2.
  3. ^ Craven, P .; Wahba, G. (1979). "Spline fonksiyonları ile gürültülü verileri yumuşatma". Numerische Mathematik. 31 (4): 377–403. doi:10.1007 / bf01404567.
  4. ^ Kimeldorf, G.S .; Wahba, G. (1970). "Stokastik Süreçler Üzerine Bayes Tahminleri ve Spline'lar Tarafından Düzeltme Arasındaki Bir Karşılık". Matematiksel İstatistik Yıllıkları. 41 (2): 495–502. doi:10.1214 / aoms / 1177697089.
  5. ^ Whittaker, E.T. (1922). "Yeni bir mezuniyet yöntemi üzerine". Edinburgh Matematik Derneği Bildirileri. 41: 63–75.
  6. ^ Rodriguez, Almanca (İlkbahar 2001). "Yumuşatma ve Parametrik Olmayan Regresyon" (PDF). 2.3.1 Hesaplama. s. 12. Alındı 28 Ağustos 2017.CS1 Maint: konum (bağlantı)
  7. ^ a b c De Boor, C. (2001). Spline'lar İçin Pratik Bir Kılavuz (Revize Edilmiş Baskı). Springer. s. 207–214. ISBN  978-0-387-90356-9.
  8. ^ a b c Reinsch, Christian H (1967). "Spline Fonksiyonları ile Düzeltme". Numerische Mathematik. 10 (3): 177–183. doi:10.1007 / BF02162161.
  9. ^ J. Duchon, 1976, Sobolev uzaylarında dönüşle değişmeyen yarı normları en aza indiren Spline'lar. s. 85–100, In: Çeşitli Değişkenlerin Fonksiyonlarının Yapıcı Teorisi, Oberwolfach 1976, W. Schempp ve K. Zeller, eds., Lecture Notes in Math., Cilt. 571, Springer, Berlin, 1977
  10. ^ Wahba, Grace. Gözlemsel Veriler için Spline Modelleri. SIAM.
  11. ^ Gu, Chong (2013). Spline ANOVA Modellerini Düzeltme (2. baskı). Springer.
  12. ^ Wood, S.N. (2017). Genelleştirilmiş Katkı Modelleri: R ile Giriş (2. baskı). Chapman & Hall / CRC. ISBN  978-1-58488-474-3.
  13. ^ Eilers, P.H.C. ve Marx B. (1996). "B-spline'lar ve cezalar ile esnek yumuşatma". İstatistik Bilimi. 11 (2): 89–121.
  14. ^ Ruppert, David; Değnek, M. P .; Carroll, R.J. (2003). Semiparametrik Regresyon. Cambridge University Press. ISBN  978-0-521-78050-6.

daha fazla okuma

  • Wahba, G. (1990). Gözlemsel Veriler için Spline Modelleri. SIAM, Philadelphia.
  • Green, P.J. ve Silverman, B.W. (1994). Parametrik Olmayan Regresyon ve Genelleştirilmiş Doğrusal Modeller. CRC Basın.
  • De Boor, C. (2001). Spline'lar İçin Pratik Bir Kılavuz (Revize Edilmiş Baskı). Springer.