Levenberg – Marquardt algoritması - Levenberg–Marquardt algorithm

İçinde matematik ve bilgi işlem, Levenberg – Marquardt algoritması (LMA ya da sadece LM) olarak da bilinir sönümlü en küçük kareler (DLS) yöntemi, çözmek için kullanılır doğrusal olmayan en küçük kareler sorunlar. Bu minimizasyon sorunları özellikle en küçük kareler eğri uydurma.

LMA, genel eğri uydurma problemlerini çözmek için birçok yazılım uygulamasında kullanılır. Bununla birlikte, birçok uydurma algoritmasında olduğu gibi, LMA yalnızca bir yerel minimum, ki bu zorunlu olarak küresel minimum. LMA, Gauss – Newton algoritması (GNA) ve yöntemi dereceli alçalma. LMA daha fazlasıdır güçlü GNA'dan daha iyidir, bu da çoğu durumda nihai minimumdan çok uzakta başlasa bile bir çözüm bulduğu anlamına gelir. İyi davranan işlevler ve makul başlangıç ​​parametreleri için, LMA, GNA'dan biraz daha yavaş olma eğilimindedir. LMA ayrıca şu şekilde de görüntülenebilir: Gauss – Newton kullanarak güven bölgesi yaklaşmak.

Algoritma ilk olarak 1944'te Kenneth Levenberg,[1] çalışırken Frankford Ordu Cephaneliği. 1963 yılında tarafından yeniden keşfedilmiştir. Donald Marquardt,[2] kim çalıştı istatistikçi -de DuPont ve bağımsız olarak Girard tarafından,[3] Wynne[4] ve Morrison.[5]

Sorun

Levenberg-Marquardt algoritmasının birincil uygulaması, en küçük kareler eğri uydurma problemidir: bir dizi verildiğinde ampirik çiftler bağımsız ve bağımlı değişkenlerin parametrelerini bulun model eğrisinin böylece sapmaların karelerinin toplamı küçültüldü:

boş olmadığı varsayılır.

Çözüm

Diğer sayısal küçültme algoritmaları gibi, Levenberg – Marquardt algoritması da bir yinelemeli prosedür. Bir küçültmeyi başlatmak için, kullanıcının parametre vektörü için bir ilk tahmin sağlaması gerekir. . Yalnızca bir minimumun olduğu durumlarda, bilgisiz standart bir tahmin gibi iyi çalışacak; olan durumlarda çoklu minimum algoritma, yalnızca ilk tahmin zaten nihai çözüme biraz yakınsa global minimuma yakınsar.

Her bir yineleme adımında, parametre vektörü yeni bir tahminle değiştirilir . Karar vermek , işlev yaklaşık olarak doğrusallaştırma:

nerede

... gradyan (bu durumda satır vektörü) / göre .

Toplam kare sapmaların minimum değeri sıfırdır gradyan göre . Yukarıdaki birinci dereceden yaklaşım verir

veya vektör gösteriminde,

Türevini almak göre ve sonucu sıfıra ayarlamak

nerede ... Jacobian matrisi, kimin -th satır eşittir , ve nerede ve vektörler -nci bileşen ve sırasıyla. İçin elde edilen yukarıdaki ifade Gauss-Newton yöntemi kapsamında gelir. Yukarıda tanımlandığı gibi Jacobian matrisi (genel olarak) bir kare matris değil, dikdörtgen boyutunda bir matristir. , nerede parametrelerin sayısıdır (vektörün boyutu ). Matris çarpımı gerekli olanı verir kare matris ve sağ taraftaki matris-vektör çarpımı bir boyut vektörü verir . Sonuç bir dizi çözülebilen doğrusal denklemler .

Levenberg'in katkısı, bu denklemi "sönümlü versiyon" ile değiştirmektir:

nerede artış olarak veren kimlik matrisidir tahmini parametre vektörüne .

(Negatif olmayan) sönümleme faktörü her yinelemede ayarlanır. Azaltılması ise hızlıdır, daha küçük bir değer kullanılabilir ve algoritmayı Gauss – Newton algoritması bir yineleme, artıkta yetersiz azalma sağlarsa, gradyan-iniş yönüne bir adım daha yaklaşarak artırılabilir. Unutmayın ki gradyan nın-nin göre eşittir . Bu nedenle, büyük değerler için adım yaklaşık olarak degradenin tersi yönde atılacaktır. Hesaplanan adımın uzunluğu veya en son parametre vektöründen kareler toplamının azaltılması önceden tanımlanmış sınırların, yineleme duraklarının ve son parametre vektörünün altına düşmesi çözüm olarak kabul edilir.

Levenberg'in algoritmasının dezavantajı, sönümleme faktörünün değerinin büyük, tersine hiç kullanılmıyor. Fletcher, degradenin her bir bileşenini eğriliğe göre ölçeklendirebileceğimizi ve böylece degradenin daha küçük olduğu yönler boyunca daha büyük hareketin olacağına dair içgörü sağladı. Bu, küçük gradyan yönünde yavaş yakınsamayı önler. Bu nedenle, Fletcher 1971 makalesinde Doğrusal olmayan en küçük kareler için değiştirilmiş bir Marquardt alt yordamı kimlik matrisini değiştirdi köşegen elemanlarından oluşan köşegen matris ile , böylece çözüm ölçeğini değişmez hale getirir:

Benzer bir sönümleme faktörü, Tikhonov düzenlenmesi doğrusal çözmek için kullanılan kötü niyetli sorunlar yanı sıra sırt gerilemesi, bir tahmin teknik İstatistik.

Sönümleme parametresi seçimi

Sönümleme parametresi için en iyi seçim için az çok sezgisel argümanlar ileri sürülmüştür. . Bu seçimlerden bazılarının algoritmanın yerel yakınsamasını neden garanti ettiğini gösteren teorik argümanlar mevcuttur; ancak, bu seçimler, algoritmanın küresel yakınsamasını aşağıdaki istenmeyen özelliklerden muzdarip hale getirebilir: en dik iniş özellikle optimuma yakın çok yavaş yakınsama.

Herhangi bir seçimin mutlak değerleri, ilk sorunun ne kadar iyi ölçeklendiğine bağlıdır. Marquardt bir değerle başlamayı önerdi ve bir faktör . Başlangıçta ayar ve kalan karelerin toplamını hesaplamak başlangıç ​​noktasından bir adım sonra sönümleme faktörü ile ve ikincisi ile . Bunların her ikisi de başlangıç ​​noktasından daha kötüyse, sönümleme ardışık çarpma ile arttırılır. yeni bir sönümleme faktörü ile daha iyi bir nokta bulunana kadar bazı .

Sönümleme faktörünün kullanılması durumunda karede bir azalma ile sonuçlanır, bu durumda bu, yeni değer olarak alınır. (ve bu sönümleme faktörü ile elde edilen yeni optimum konum alınır) ve süreç devam eder; kullanılıyorsa daha kötü bir kalıntıyla sonuçlandı, ancak daha iyi bir kalıntıyla sonuçlandı, o zaman değişmeden bırakılır ve yeni optimum, ile elde edilen değer olarak alınır. sönümleme faktörü olarak.

Sönümleme parametresinin kontrolü için etkili bir strateji olarak adlandırılan gecikmiş haz, parametrenin her yokuş yukarı adım için küçük bir miktar artırılması ve her yokuş aşağı adım için büyük miktarda azaltılmasıdır. Bu stratejinin arkasındaki fikir, optimizasyonun başlangıcında yokuş aşağı çok hızlı hareket etmekten kaçınmak, bu nedenle gelecekteki yinelemelerde mevcut adımları kısıtlamak ve dolayısıyla yakınsamayı yavaşlatmaktır.[6] Çoğu durumda 2 kat artış ve 3 kat azalmanın etkili olduğu gösterilmiştir, büyük problemler için ise 1,5 kat artış ve faktör azalması ile daha uç değerler daha iyi çalışabilir. arasında 5.[7]

Jeodezik ivme

Levenberg – Marquardt adımını hız olarak yorumlarken boyunca jeodezik parametre uzayında yol, ivmeyi açıklayan ikinci dereceden bir terim ekleyerek yöntemi geliştirmek mümkündür. jeodezik boyunca

nerede çözümü

Bu jeodezik ivme terimi yalnızca Yönlü türev hızın yönü boyunca , tam ikinci dereceden türev matrisinin hesaplanmasını gerektirmez, hesaplama maliyeti açısından sadece küçük bir ek yük gerektirir.[8] İkinci dereceden türev oldukça karmaşık bir ifade olabileceğinden, onu bir ile değiştirmek uygun olabilir. Sonlu fark yaklaşım

nerede ve algoritma tarafından zaten hesaplanmıştır, bu nedenle hesaplamak için yalnızca bir ek fonksiyon değerlendirmesi gerektirir . Sonlu fark adımının seçimi algoritmanın kararlılığını etkileyebilir ve yaklaşık 0,1'lik bir değer genel olarak mantıklıdır.[7]

İvme, hıza zıt yönü gösterebileceğinden, sönümlemenin çok küçük olması durumunda yöntemin durmasını önlemek için, bir adımı kabul etmek için ivmeye ek bir kriter eklenir.

nerede genellikle 1'den küçük bir değere sabitlenir, daha zor problemler için daha küçük değerlere sahiptir.[7]

Bir jeodezik hızlandırma teriminin eklenmesi, yakınsama hızında önemli bir artışa izin verebilir ve özellikle algoritma, amaç fonksiyonunun peyzajındaki dar kanyonlarda hareket ederken, izin verilen adımların daha küçük ve ikinci dereceden dolayı daha yüksek doğrulukta olduğu durumlarda yararlıdır. terim önemli gelişmeler sağlar.[7]

Misal

Kötü uyum
Daha uygun
En uygun

Bu örnekte işlevi uydurmaya çalışıyoruz Levenberg – Marquardt algoritmasını kullanarak GNU Oktav olarak leasqr işlevi. Grafikler, parametreler için giderek daha iyi uyumu gösteriyor , başlangıç ​​eğrisinde kullanılır. Yalnızca son grafikteki parametreler orijinale en yakın seçildiğinde, eğriler tam olarak uyuyor. Bu denklem, Levenberg – Marquardt algoritması için çok hassas başlangıç ​​koşullarına bir örnektir. Bu duyarlılığın bir nedeni, çoklu minimumların varlığıdır - fonksiyon parametre değerinde minimuma sahiptir ve .

Ayrıca bakınız

Referanslar

  1. ^ Levenberg, Kenneth (1944). "En Küçük Karelerdeki Bazı Doğrusal Olmayan Sorunların Çözümü İçin Bir Yöntem". Üç Aylık Uygulamalı Matematik. 2 (2): 164–168. doi:10.1090 / qam / 10666.
  2. ^ Marquardt, Donald (1963). "Doğrusal Olmayan Parametrelerin En Küçük Kareler Tahmini için Bir Algoritma". SIAM Uygulamalı Matematik Dergisi. 11 (2): 431–441. doi:10.1137/0111030. hdl:10338.dmlcz / 104299.
  3. ^ Girard, André (1958). "Alıntı Revue d'optique théorique et enstrümantal". Rev. Opt. 37: 225–241, 397–424.
  4. ^ Wynne, C.G. (1959). "Elektronik Dijital Bilgisayarla Lens Tasarımı: I". Proc. Phys. Soc. Lond. 73 (5): 777–787. Bibcode:1959PPS .... 73..777W. doi:10.1088/0370-1328/73/5/310.
  5. ^ Morrison, David D. (1960). "Doğrusal olmayan en küçük kareler problemleri ve yakınsama ispatları için yöntemler". Takip Programları ve Yörünge Tespiti Konulu Jet Tahrik Laboratuvarı Semineri Bildirileri: 1–9.
  6. ^ Transtrum, Mark K; Machta, Benjamin B; Sethna, James P (2011). "Özensiz modellere uygulamalar ve optimizasyon ile doğrusal olmayan en küçük karelerin geometrisi". Fiziksel İnceleme E. APS. 83 (3): 036701.
  7. ^ a b c d Transtrum, Mark K; Sethna, James P (2012). "Doğrusal olmayan en küçük karelerin en aza indirilmesi için Levenberg-Marquardt algoritmasında iyileştirmeler". arXiv:1201.5885.
  8. ^ "Doğrusal Olmayan En Küçük Kareler Uydurma". GNU Bilimsel Kitaplığı. Arşivlenen orijinal 2020-04-14 tarihinde.
  9. ^ Kanzow, Christian; Yamashita, Nobuo; Fukushima, Masao (2004). "Dışbükey kısıtlamalara sahip doğrusal olmayan denklemleri çözmek için güçlü yerel yakınsama özelliklerine sahip Levenberg – Marquardt yöntemleri". Hesaplamalı ve Uygulamalı Matematik Dergisi. 172 (2): 375–397. doi:10.1016 / j.cam.2004.02.013.

daha fazla okuma

Dış bağlantılar