Rastgele koordinat inişi - Random coordinate descent

Randomized (Block) Coordinate Descent Method, Nesterov (2010) ve Richtárik ve Takáč (2011) tarafından popüler hale getirilen bir optimizasyon algoritmasıdır. Düzgün bir dışbükey işlevi en aza indirme problemine uygulandığında bu yöntemin ilk analizi Nesterov (2010) tarafından yapılmıştır.[1] Nesterov'un analizinde yöntemin, orijinal fonksiyonun bilinmeyen bir ölçekleme faktörüyle ikinci dereceden bir pertürbasyonuna uygulanması gerekir. Richtárik ve Takáč (2011) bunu gerektirmeyen yineleme karmaşıklığı sınırları verir, yani yöntem doğrudan amaç işlevine uygulanır. Dahası, bir kompozit fonksiyonu en aza indirme problemine, yani pürüzsüz bir dışbükey ve (muhtemelen düz olmayan) bir dışbükey blok ayrılabilir fonksiyonun toplamını genelleştirir:

nerede ayrıştırılır değişken / koordinat blokları: ve (basit) dışbükey fonksiyonlardır.

Örnek (blok ayrıştırma): Eğer ve biri seçebilir ve .

Örnek (blokla ayrılabilir düzenleyiciler):

  1. , nerede ve standart Öklid normudur.

Algoritma

Optimizasyon sorununu düşünün

nerede bir dışbükey ve pürüzsüz işlev.

Pürüzsüzlük: Pürüzsüzlük derken şunu kastediyoruz: gradyanı varsayıyoruz koordinat açısından Lipschitz sabitlerle süreklidir . Yani, varsayıyoruz ki

hepsi için ve , nerede değişkene göre kısmi türevi gösterir .

Nesterov ve Richtarik ve Takac, aşağıdaki algoritmanın optimal noktaya yakınsadığını gösterdi:

Algoritma Rastgele Koordinat Alçalma Yöntemi Girdisi:  // başlangıç ​​noktası Çıktı:     Ayarlamak x : = x_0 için k := 1, ... yapmak        koordinat seçin , rastgele güncellemede tekdüze olarak      sonu için
  • "←", Görev. Örneğin, "en büyükeşya"değerinin en büyük değerindeki değişiklikler eşya.
  • "dönüş"algoritmayı sonlandırır ve aşağıdaki değeri verir.

Yakınsama oranı

Bu algoritmanın yinelemeleri rasgele vektörler olduğundan, karmaşıklık sonucu, yöntemin yüksek olasılıkla yaklaşık bir çözüm üretmesi için gereken yineleme sayısına bir sınır verecektir. Gösterildi [2] Eğer , nerede , optimal bir çözümdür (), bir güven seviyesidir ve hedef doğruluğu, o zaman .

Belirli işlevle ilgili örnek

Aşağıdaki Şekil, prensip olarak yinelemeler sırasında gelişir. sorun şu ki

Küçük problem üzerinde yakınsama.jpg

Koordinat ayarını engellemek için uzantı

Koordinat yönlerini blok koordinat yönlerine engelleme

Bu algoritma doğal olarak yalnızca koordinatlara değil, koordinat bloklarına da genişletilebilir. Alanımız olduğunu varsayın . Bu boşluk somut olarak 5 koordinat yönüne sahiptirRastgele Koordinat İniş Yöntemi'nin hareket edebileceği Ancak, bazı koordinat yönlerini bloklar halinde gruplayabiliriz ve bu 5 koordinat yönü yerine 3 blok koordinat yönü alabiliriz (resme bakın).

Ayrıca bakınız

Referanslar

  1. ^ Nesterov, Yurii (2010), "Koordinat iniş yöntemlerinin büyük ölçekli optimizasyon problemlerinde etkinliği", SIAM Optimizasyon Dergisi, 22 (2): 341–362, CiteSeerX  10.1.1.332.3336, doi:10.1137/100802001
  2. ^ Richtárik, Peter; Takáč, Martin (2011), "Bileşik bir işlevi en aza indirmek için rastgele blok koordinat iniş yöntemlerinin yineleme karmaşıklığı", Matematiksel Programlama, Seri A, 144 (1–2): 1–38, arXiv:1107.2848, doi:10.1007 / s10107-012-0614-z