Alt gradyan yöntemi - Subgradient method - Wikipedia

Alt gradyan yöntemleri vardır yinelemeli yöntemler çözmek için dışbükey küçültme sorunlar. Başlangıçta tarafından geliştirilmiştir Naum Z. Shor ve diğerleri 1960'larda ve 1970'lerde, alt gradyan yöntemleri, türevlenemeyen nesnel bir işleve uygulandığında bile yakınsaktır. Amaç işlevi ayırt edilebilir olduğunda, kısıtlanmamış problemler için alt gradyan yöntemleri, yöntemle aynı arama yönünü kullanır. en dik iniş.

Alt gradyan yöntemleri, iki kez sürekli türevlenebilir dışbükey fonksiyonları en aza indirmek için uygulandığında Newton yönteminden daha yavaştır. Bununla birlikte, Newton'un yöntemi, türevlenemeyen sapmalara sahip problemlerde yakınsama konusunda başarısız olur.

Son yıllarda bazıları iç nokta yöntemleri konveks minimizasyon problemleri için önerilmiştir, ancak alt gradyan projeksiyon metotları ve ilgili grup iniş metotları rekabetçi kalır. Çok fazla boyuta sahip dışbükey minimizasyon problemleri için, alt gradyan-projeksiyon yöntemleri uygundur çünkü az depolama gerektirirler.

Alt gradyan projeksiyon yöntemleri genellikle ayrıştırma teknikleriyle büyük ölçekli problemlere uygulanır. Bu tür ayrıştırma yöntemleri genellikle bir problem için basit dağıtılmış bir yönteme izin verir.

Klasik alt gradyan kuralları

İzin Vermek olmak dışbükey işlev etki alanı ile . Klasik bir alt gradyan yöntemi yinelenir

nerede gösterir hiç alt gradyan nın-nin -de , ve ... yinelemesi . Eğer türevlenebilir, bu durumda tek alt gradyanı gradyan vektörüdür kendisi olabilir. iniş yönü değil -de . Bu nedenle bir liste tutuyoruz şu ana kadar bulunan en düşük amaç fonksiyon değerini takip eden, yani

Adım boyutu kuralları

Alt gradyan yöntemleri tarafından birçok farklı adım boyutu kuralı kullanılır. Bu makale, yakınsama için beş klasik adım boyutu kuralına dikkat çekiyor. kanıtlar biliniyor:

  • Sabit adım boyutu,
  • Sabit adım uzunluğu, hangi verir
  • Kare şeklinde toplanabilir ancak toplanamayan adım boyutu, yani tatmin edici herhangi bir adım boyutu
  • Tüketilemeyen küçülme, yani tatmin edici herhangi bir adım boyutu
  • Saydam olmayan azalan adım uzunlukları, yani , nerede

Beş kuralın tümü için, adım boyutları, yöntem yinelenmeden önce "çevrimdışı" olarak belirlenir; adım boyutları önceki yinelemelere bağlı değildir. Alt gradyan yöntemlerinin bu "çevrim dışı" özelliği, farklılaştırılabilir işlevler için alçalma yöntemlerinde kullanılan "çevrimiçi" adım boyutu kurallarından farklıdır: Farklılaştırılabilir işlevleri en aza indirmeye yönelik birçok yöntem, Wolfe'un yakınsama için yeterli koşullarını karşılar; geçerli nokta ve mevcut arama yönü. Bertsekas'ın kitaplarında artımlı sürümler de dahil olmak üzere alt gradyan yöntemleri için aşamalı boyut kurallarının kapsamlı bir tartışması verilmiştir.[1]Bertsekas, Nedic ve Özdağlar. [2]

Yakınsama sonuçları

Sabit adım uzunluğu ve ölçeklendirilmiş alt gradyanlar için Öklid normu bire eşit olarak, alt gradyan yöntemi minimum değere keyfi olarak yakın bir yaklaşıma yakınsar, yani

sonucu Shor.[3]

Bu klasik alt gradyan yöntemlerinin performansı düşüktür ve artık genel kullanım için önerilmemektedir.[4][5] Bununla birlikte, basit olmaları ve problemin özel yapısından yararlanmak için kolayca uyarlanabildikleri için özel uygulamalarda hala yaygın olarak kullanılmaktadırlar.

Alt gradyan-projeksiyon ve grup yöntemleri

1970'lerde, Claude Lemaréchal ve Phil Wolfe, dışbükey minimizasyon problemleri için iniş "demet yöntemleri" önermiştir.[6] O zamandan beri "paket yöntemleri" teriminin anlamı önemli ölçüde değişti. Modern versiyonlar ve tam yakınsama analizi Kiwiel tarafından sağlandı.[7] Çağdaş paket yöntemleri genellikle "seviye Boris T. Polyak'ın (1969) "alt gradyan-projeksiyon" yönteminden teknikler geliştirmek için "adım boyutlarını seçmek için kurallar" Ancak, demet yöntemlerinin alt gradyan projeksiyon yöntemlerine göre çok az avantaj sunduğu sorunlar vardır.[4][5]

Kısıtlı optimizasyon

Öngörülen alt gradyan

Alt gradyan yönteminin bir uzantısı, öngörülen alt gradyan yöntemi, kısıtlı optimizasyon problemini çözen

küçültmek tabi

nerede bir dışbükey küme. Öngörülen alt gradyan yöntemi yinelemeyi kullanır

nerede projeksiyon ve herhangi bir alt gradyanı -de

Genel kısıtlamalar

Alt gradyan yöntemi, eşitsizlik kısıtlı problemi çözmek için genişletilebilir

küçültmek tabi

nerede dışbükeydir. Algoritma, kısıtsız durumla aynı formu alır

nerede adım boyutudur ve hedefin bir alt gradyanı veya sınırlama fonksiyonlarından biridir. Al

nerede gösterir alt farklı nın-nin . Mevcut nokta uygulanabilirse, algoritma nesnel bir alt gradyan kullanır; mevcut nokta uygulanabilir değilse, algoritma ihlal edilen herhangi bir kısıtlamanın bir alt gradyanı seçer.

Referanslar

  1. ^ Bertsekas, Dimitri P. (2015). Konveks Optimizasyon Algoritmaları (İkinci baskı). Belmont, MA.: Athena Scientific. ISBN  978-1-886529-28-1.
  2. ^ Bertsekas, Dimitri P .; Nedic, Angelia; Özdağlar, Asuman (2003). Konveks Analiz ve Optimizasyon (İkinci baskı). Belmont, MA.: Athena Scientific. ISBN  1-886529-45-0.
  3. ^ Sabit adım boyutlu (ölçeklendirilmiş) alt gradyan yönteminin yaklaşık yakınsaması, Alıştırma 6.3.14 (a) 'da Bertsekas (sayfa 636): Bertsekas, Dimitri P. (1999). Doğrusal Olmayan Programlama (İkinci baskı). Cambridge, MA .: Athena Scientific. ISBN  1-886529-00-0. 636. sayfada, Bertsekas bu sonucu Shor'a atfeder: Shor, Naum Z. (1985). Türevlenemeyen Fonksiyonlar İçin Minimizasyon Yöntemleri. Springer-Verlag. ISBN  0-387-12763-1.
  4. ^ a b Lemaréchal, Claude (2001). "Lagrange rahatlaması". Michael Jünger ve Denis Naddef'de (ed.). Hesaplamalı kombinatoryal optimizasyon: 15–19 Mayıs 2000'de Schloß Dagstuhl'da düzenlenen Bahar Okulu'ndan makaleler. Bilgisayar Bilimlerinde Ders Notları. 2241. Berlin: Springer-Verlag. s. 112–156. doi:10.1007/3-540-45586-8_4. ISBN  3-540-42877-1. BAY  1900016.CS1 bakimi: ref = harv (bağlantı)
  5. ^ a b Kiwiel, Krzysztof C .; Larsson, Torbjörn; Lindberg, P. O. (Ağustos 2007). "Ballstep alt gradyan yöntemleriyle Lagrange gevşemesi". Yöneylem Araştırması Matematiği. 32 (3): 669–686. doi:10.1287 / moor.1070.0261. BAY  2348241.CS1 bakimi: ref = harv (bağlantı)
  6. ^ Bertsekas, Dimitri P. (1999). Doğrusal Olmayan Programlama (İkinci baskı). Cambridge, MA.: Athena Scientific. ISBN  1-886529-00-0.
  7. ^ Kiwiel, Krzysztof (1985). Farklılaşmaz Optimizasyon İçin Alçalma Yöntemleri. Berlin: Springer Verlag. s. 362. ISBN  978-3540156420. BAY  0797754.

daha fazla okuma

Dış bağlantılar

  • EE364A ve EE364B, Stanford'un dışbükey optimizasyon kurs dizisi.