Doğrusal olmayan eşlenik gradyan yöntemi - Nonlinear conjugate gradient method - Wikipedia

İçinde sayısal optimizasyon, doğrusal olmayan eşlenik gradyan yöntemi genelleştirir eşlenik gradyan yöntemi -e doğrusal olmayan optimizasyon. İkinci dereceden bir işlev için

minimum ne zaman elde edilir gradyan 0:

.

Doğrusal eşlenik gradyan doğrusal denklem için bir çözüm ararken Doğrusal olmayan eşlenik gradyan yöntemi genellikle şunu bulmak için kullanılır yerel minimum doğrusal olmayan bir fonksiyonun gradyan tek başına. Fonksiyon minimuma yakın yaklaşık olarak ikinci dereceden olduğunda çalışır; bu, fonksiyonun minimumda iki kez türevlenebilir olduğu ve ikinci türevin burada tekil olmadığı durumdur.

Bir işlev verildiğinde nın-nin en aza indirilecek değişkenler, gradyan maksimum artışın yönünü gösterir. Biri basitçe tersinden başlar (en dik iniş ) yön:

ayarlanabilir adım uzunluğu ile ve gerçekleştirir satır arama minimuma ulaşana kadar bu yönde :

,

En dik yöndeki bu ilk iterasyondan sonra Aşağıdaki adımlar, sonraki bir eşlenik yön boyunca hareket etmenin bir yinelemesini oluşturur , nerede :

  1. En dik yönü hesaplayın: ,
  2. Hesaplama aşağıdaki formüllerden birine göre,
  3. Eşlenik yönünü güncelleyin:
  4. Bir satır araması yapın: optimize edin ,
  5. Pozisyonu güncelleyin: ,

Saf ikinci dereceden bir fonksiyonla minimuma N yinelemeler (yuvarlama hatası hariç), ancak ikinci dereceden olmayan bir işlev daha yavaş ilerleme sağlayacaktır. Sonraki arama yönleri, arama yönünün en azından her seferinde en dik iniş yönüne sıfırlanmasını gerektiren eşleniği kaybeder. N yinelemeler veya ilerleme durursa daha erken. Ancak, her yinelemenin sıfırlanması yöntemi en dik iniş. Algoritma minimum bulduğunda, bir yön sıfırlamasından sonra (yani en dik iniş yönünde) ilerleme kaydedilmediğinde veya bazı tolerans kriterlerine ulaşıldığında belirlenir.

Doğrusal bir yaklaşım dahilinde, parametreler ve doğrusal eşlenik gradyan yöntemi ile aynıdır, ancak çizgi aramaları ile elde edilmiştir. eşlenik gradyan yöntemi dar izleyebilir (kötü şartlandırılmış ) vadiler, nerede en dik iniş yöntem yavaşlar ve çapraz bir model izler.

En iyi bilinen dört formül geliştiricilerinin adını alır:

  • Fletcher-Reeves:[1]
  • Polak – Ribière:[2]
  • Hestenes-Stiefel:[3]
  • Dai – Yuan:[4]
.

Bu formüller, ikinci dereceden bir işlev için eşdeğerdir, ancak doğrusal olmayan optimizasyon için tercih edilen formül, bir buluşsal yöntem veya tat meselesidir. Popüler bir seçim , otomatik olarak bir yön sıfırlaması sağlar.[5]

Dayalı algoritmalar Newton yöntemi potansiyel olarak çok daha hızlı yakınsama. Orada, hem adım yönü hem de uzunluk, katsayı matrisi kesin olmak üzere, doğrusal bir denklem sisteminin çözümü olarak gradyandan hesaplanır. Hessen matrisi (Newton yöntemi için uygun) veya bunun bir tahmini ( yarı-Newton yöntemleri, yinelemeler sırasında gradyanda gözlemlenen değişiklik, Hessian tahminini güncellemek için kullanılır). Yüksek boyutlu problemler için, Hessian'ın kesin hesaplaması genellikle aşırı derecede pahalıdır ve hatta depolanması problemli olabilir, hafıza (ancak sınırlı hafıza L-BFGS yarı-Newton yöntemi).

Eşlenik gradyan yöntemi de kullanılarak türetilebilir optimal kontrol teorisi.[6] Bu hızlandırılmış optimizasyon teorisinde, eşlenik gradyan yöntemi doğrusal olmayan optimal geri besleme kontrolörü,

için çift ​​entegratör sistemi,

Miktarlar ve değişken geri bildirim kazanımlarıdır.[6]

Ayrıca bakınız

Referanslar

  1. ^ Fletcher, R .; Reeves, C.M. (1964). "Eşlenik gradyanlarla fonksiyon minimizasyonu". Bilgisayar. J. 7: 149–154.
  2. ^ Polak, E .; Ribière, G. (1969). "Conjuguées yönüne dikkat edin". Rev. Française Informat Recherche Opérationelle. 3 (1): 35–43.
  3. ^ Hestenes, M.R .; Stiefel, E. (1952). "Doğrusal Sistemleri Çözmek İçin Eşlenik Gradyan Yöntemleri". J. Research Nat. Bur. Standartlar. 49: 409–436.
  4. ^ Dai, Y.-H .; Yuan, Y. (1999). "Güçlü bir küresel yakınsama özelliğine sahip doğrusal olmayan eşlenik gradyan yöntemi". SIAM J. Optim. 10 (1): 177–182. doi:10.1137 / S1052623497318992.
  5. ^ Shewchuk, J.R. (Ağustos 1994). "Acı Çekmeyen Eşlenik Gradyan Yöntemine Giriş" (PDF).
  6. ^ a b Ross, I. M. (2019). "Hızlandırılmış Optimizasyon için Optimal Kontrol Teorisi". arXiv:1902.09004. Alıntı dergisi gerektirir | günlük = (Yardım)