Drift artı ceza - Drift plus penalty

Matematiksel olasılık teorisinde, drift-plus-ceza yöntemi optimizasyonu için kullanılır kuyruk ağları ve diğeri stokastik sistemler.

Teknik, bir kuyruk ağını stabilize ederken aynı zamanda bir ağ ceza işlevinin zaman ortalamasını en aza indirmek içindir. Zaman ortalamalı güç, iş hacmi ve iş hacmi yardımcı programı gibi performans hedeflerini optimize etmek için kullanılabilir.[1][2]En aza indirilmesi gereken özel bir durumda ve amaç, çok sekmeli bir ağda kararlı bir yönlendirme politikası tasarlamak olduğunda, yöntem şu şekilde azalır: geri basınç yönlendirme.[3][4]Sürüklenme artı ceza yöntemi aynı zamanda bir sürenin ortalamasını en aza indirmek için de kullanılabilir. Stokastik süreç diğer stokastik süreçlerin bir toplamı üzerindeki ortalama zaman kısıtlamalarına tabidir.[5]Bu, uygun bir dizi tanımlayarak yapılır. sanal kuyruklar. Ayrıca, zaman ortalamalı çözümler üretmek için de kullanılabilir. dışbükey optimizasyon sorunlar. [6][7]

Metodoloji

Sürüklenme artı ceza yöntemi, zaman aralıklarıyla ayrı zamanlarda çalışan kuyruk sistemleri için geçerlidir. t {0, 1, 2, ...} içinde. İlk olarak, negatif olmayan bir fonksiyon L(t) tüm kuyrukların zamanındaki durumunun skaler bir ölçüsü olarak tanımlanırt. İşlev L(t) tipik olarak tüm kuyruk boyutlarının karelerinin toplamı olarak tanımlanır tve denir Lyapunov işlevi. Lyapunov kayması tanımlanmış:

Her yuva t, mevcut kuyruk durumu gözlemlenir ve aşağıdakilerle ilgili bir sınırı iştahla en aza indirmek için kontrol eylemleri yapılır. drift-plus-ceza ifadesi:

nerede p(t) ceza fonksiyonudur ve V, negatif olmayan bir ağırlıktır. V parametresi, zaman ortalamasını sağlamak için seçilebilir. p(t), ortalama kuyruk boyutunda karşılık gelen bir değiş tokuşla, isteğe bağlı olarak optimuma yakındır. Sevmek geri basınç yönlendirme, bu yöntem tipik olarak işe girişler ve ağ hareketliliği için olasılık dağılımları hakkında bilgi gerektirmez.[5]

Kökenler ve uygulamalar

Ne zaman yöntem, Lyapunov kaymasını açgözlülükle en aza indirmeye indirgenir. Bu, geri basınç yönlendirme ilk olarak Tassiulas ve Ephremides tarafından geliştirilen algoritma (aynı zamanda maksimum ağırlık algoritması).[3][8] Neely tarafından drift ifadesine terim eklendi[9] ve Neely, Modiano, Li[2] bir ağı stabilize ederken aynı zamanda bir verim yardımcı programı işlevini en üst düzeye çıkarmak için. Bunun için ceza olarak tanımlandı slotta kazanılan ödülün katı Bu sürüklenme artı ceza tekniği daha sonra ortalama gücü en aza indirmek için kullanıldı[1] ve diğer ceza ve ödül ölçütlerini optimize edin.[4][5]

Teori, öncelikle kablosuz ağlar, geçici mobil ağlar ve diğer bilgisayar ağları dahil olmak üzere iletişim ağlarını optimize etmek için geliştirilmiştir. Bununla birlikte, matematiksel teknikler, yenilenebilir enerji tahsisi dahil olmak üzere diğer stokastik sistemler için optimizasyon ve kontrol için uygulanabilir. akıllı güç ızgaraları[10][11][12] ve stok kontrolü ürün montaj sistemleri için.[13]

Nasıl çalışır

Bu bölüm, diğer işlevlerin bir koleksiyonundaki zaman ortalama kısıtlamalarına tabi bir p (t) işlevinin zaman ortalamasını en aza indirmek için sürüklenme artı ceza yönteminin nasıl kullanılacağını gösterir. Aşağıdaki analiz, içindeki malzemeye dayanmaktadır.[5]

Stokastik optimizasyon problemi

{0, 1, 2, ...} içindeki normalleştirilmiş zaman aralıkları t üzerinde gelişen ayrı bir zaman sistemini düşünün. P (t) 'yi, zaman ortalaması en aza indirilmesi gereken bir fonksiyon olarak tanımlayın. ceza fonksiyonu. Diyelim ki p (t) zaman ortalamasının en aza indirilmesi, K diğer fonksiyonların bir koleksiyonunda zaman-ortalama kısıtlamalarına tabi olarak yapılmalıdır:

Her t slotunda, ağ denetleyicisi yeni bir rastgele olay gözlemler. Daha sonra bu olayın bilgisine dayanarak bir kontrol eylemi yapar. P (t) ve y_i (t) değerleri, rastgele olayın ve t slotundaki kontrol eyleminin fonksiyonları olarak belirlenir:

Küçük durum notasyonu p (t), y_i (t) ve büyük harf notasyonu P (), Y_i (), ceza değerlerini, bu değerleri rastgele olaya ve t slotu için kontrol eylemine göre belirleyen işlevden ayırmak için kullanılır. Rastgele olay bazı soyut olaylar dizisinde değer aldığı varsayılır . Kontrol eylemi bazı soyut setler içinde seçildiği varsayılmaktadır kontrol seçeneklerini içeren. Takımlar ve keyfi ve sonlu veya sonsuz olabilir. Örneğin, soyut elemanların sınırlı bir listesi, sayılamayacak kadar sonsuz (ve muhtemelen dışbükey olmayan) gerçek değerli vektörler koleksiyonu vb. olabilir. P (), Y_i () fonksiyonları da keyfidir ve süreklilik veya dışbükeylik varsayımları gerektirmez.

İletişim ağları bağlamında bir örnek olarak, rastgele olay her düğüm için dilim varış bilgisini ve her bağlantı için dilim kanal durum bilgisini içeren bir vektör olabilir. Kontrol eylemi her düğüm için yönlendirme ve iletim kararlarını içeren bir vektör olabilir. P () ve Y_i () fonksiyonları, t slotu için kontrol eylemi ve kanal koşulu ile ilişkili güç harcamalarını veya iş hacmini temsil edebilir.

Açıklamanın basitliği için, P () ve Y_i () fonksiyonlarının sınırlı olduğunu varsayın. Ayrıca rastgele olay sürecini varsayalım dır-dir bağımsız ve aynı şekilde dağıtılmış (i.i.d.) t olasılıkla bilinmeyen bazı olasılık dağılımıyla yuvalar üzerinden. Amaç, aşağıdaki problemi çözmek için zaman içinde kontrol eylemleri yapmak için bir politika tasarlamaktır:

Bu sorunun baştan sona olduğu varsayılmıştır. mümkün. Yani, tüm bunları karşılayabilecek bir algoritma olduğu varsayılır. K istenen kısıtlamalar.

Yukarıdaki problem, her kısıtlamayı ortaya çıkarır. standart biçim soyut bir süreç y_i (t) pozitif olmayan bir zaman ortalama beklentisi. Bu yaklaşımda genellik kaybı yoktur. Örneğin, bazı süreçlerin a (t) zaman ortalama beklentisinin belirli bir c sabitinden küçük veya ona eşit olmasını istediğini varsayalım. Sonra yeni bir ceza fonksiyonu y(t) = a(t) − c tanımlanabilir ve istenen kısıtlama, ortalama zaman beklentisine eşdeğerdir. y(t) pozitif olmamak. Aynı şekilde, iki işlem olduğunu varsayalım a(t) ve b(t) ve biri için zaman ortalama beklentisi a(t) şundan küçük veya ona eşit olmakb(t). Bu kısıtlama, yeni bir ceza fonksiyonu tanımlanarak standart biçimde yazılmıştır. y(t) = a(t) − b(t). Yukarıdaki problem arar küçültmek soyut ceza fonksiyonunun zaman ortalamasıp '(t) '. Bu kullanılabilir maksimize etmek bazılarının zaman ortalaması ödül işlevir(t) tanımlayarak p(t) = −r('t).

Sanal kuyruklar

Her kısıtlama için ben {1, ... içinde K}, tanımlayın sanal sıra yuvalar üzerinde dinamiklerle t {0, 1, 2, ...} içinde şu şekilde:

Başlat Qben(0) = 0 hepsi için ben {1, ... içinde K}. Bu güncelleme denklemi, bir gerçek Backlog Q_i (t) ve y_i (t) ile yeni gelenler ve yuvadaki yeni hizmet fırsatları arasındaki fark olan ayrık zaman kuyruğut. Sezgisel olarak, bu sanal kuyrukların dengelenmesi, kısıtlama fonksiyonlarının zaman ortalamalarının sıfırdan küçük veya sıfıra eşit olmasını sağlar, böylece istenen kısıtlamalar karşılanır. Bunu tam olarak görmek için, (Denklem 1) 'in şu anlama geldiğine dikkat edin:

Bu nedenle:

Yukarıdakileri ilk t yuvaları üzerinden toplamak ve iç içe geçen toplamlar yasasını kullanmak şu anlama gelir:

Bölme ölçütü t ve beklentileri almak şu anlama gelir:

Bu nedenle, aşağıdaki {1, ..., içindeki tüm i'ler için geçerli olduğunda, sorunun istenen kısıtlamaları karşılanır. K}:

Yukarıdaki limit denklemini karşılayan bir Q_i (t) kuyruğunun ortalama oran sabit.[5]

Sürüklenme artı ceza ifadesi

Kuyrukları stabilize etmek için, yuvadaki toplam kuyruk biriktirme listesi olarak Lyapunov işlevi L (t) 'yi tanımlayınt:

Sıra denkleminin (Denklem 1) karesinin alınması, {1, ..., K} 'deki her sıra i için aşağıdaki sınırla sonuçlanır:

Bu nedenle,

Bunu takip eder

Şimdi B'yi, yukarıdaki eşitsizliğin sağ tarafındaki ilk terimi üst sınırlayan pozitif bir sabit olarak tanımlayın. Böyle bir sabit vardır çünkü y_i (t) değerleri sınırlıdır. Sonra:

Her iki tarafa Vp (t) eklemek, drift-plus-ceza ifadesinde aşağıdaki sınırla sonuçlanır:

Sürüklenme artı ceza algoritması (aşağıda tanımlanmıştır), yukarıdaki eşitsizliğin sağ tarafını açgözlülükle en aza indiren her alanda kontrol eylemleri yapar. Sezgisel olarak, tek başına sürüklenmeyi en aza indiren bir eylemde bulunmak, kuyruk istikrarı açısından yararlı olabilir, ancak ortalama süre cezasını en aza indirmez. Tek başına cezayı en aza indiren bir eylemde bulunmak, kuyrukları sabitlemek zorunda değildir. Bu nedenle, ağırlıklı toplamı en aza indirmek için bir eylemde bulunmak, hem kuyruk kararlılığı hem de cezanın en aza indirilmesi hedeflerini içerir. V ağırlığı, bir performans değiş tokuşu ile sonuçlanan ceza minimizasyonuna az ya da çok vurgu yapacak şekilde ayarlanabilir.[5]

Drift artı ceza algoritması

İzin Vermek olası tüm kontrol eylemlerinin soyut kümesi olun. Her t slotu, rastgele olayı ve mevcut kuyruk değerlerini gözlemleyin:

Alan t için bu gözlemler göz önüne alındığında, açgözlülükle bir kontrol eylemi seçin aşağıdaki ifadeyi en aza indirmek için (keyfi olarak bağları koparmak):

Sonra her bir i için sıraları {1, ..., K} 'de (Denklem 1)' e göre güncelleyin. T + 1 yuvası için bu prosedürü tekrarlayın.[5]

Yuvada gözlemlenen rastgele olay ve kuyruk biriktirme listelerinin t yuva minimizasyonu için kontrol eylemini seçerken verilen sabitler gibi hareket edin. Böylece, her yuva, set üzerindeki kontrol eylemini en aza indirmek için deterministik bir arama içerir. Bir. Bu algoritmanın temel bir özelliği, rastgele olay sürecinin olasılık dağılımına ilişkin bilgi gerektirmemesidir.

Yaklaşık planlama

Yukarıdaki algoritma, soyut bir küme üzerinden minimum bir işlev bulmayı içerir. Bir. Genel durumlarda, asgari mevcut olmayabilir veya bulunması zor olabilir. Bu nedenle, algoritmanın aşağıdaki gibi yaklaşık bir şekilde uygulandığını varsaymak faydalıdır: C negatif olmayan bir sabit olarak ve tüm alanlar için tkontrol eylemi sette seçilir Bir tatmin etmek:

Böyle bir kontrol eylemi, C-katkı yaklaşımı.[5] Dava C = 0, her yuvada istenen ifadenin tam olarak küçültülmesine karşılık gelirt.

Performans analizi

Bu bölüm, algoritmanın ortalama kuyruk boyutunda karşılık gelen bir O (V) değiş tokuşu ile optimalliğin O (1 / V) dahilinde bir zaman ortalama cezası ile sonuçlandığını göstermektedir.[5]

Ortalama ceza analizi

Tanımla -yalnızca politika Kontrol eylemini seçmek için sabit ve rastgele bir politika olmak gözlemlenene göre sadece. Yani bir -yalnızca politika, olası her rastgele olay için belirtir , bir kontrol eylemi seçmek için koşullu bir olasılık dağılımı verilen . Böyle bir politika, kararları mevcut kuyruk birikiminden bağımsız hale getirir. Varsayalım ki bir -yalnızca politika aşağıdakileri karşılar:

Yukarıdaki beklentiler rastgele değişkenle ilgilidir yuva için ve rastgele kontrol eylemi yuvada seçilmiş gözlemledikten sonra . Böyle bir politika İstenilen kontrol problemi uygulanabilir olduğunda ve olay yeri olduğunda var olduğu gösterilebilir. ve eylem alanı sonludur veya hafif kapatma özellikleri sağlandığında.[5]

İzin Vermek Negatif olmayan bazı C sabitleri için, önceki bölümün sürüklenme artı ceza algoritmasının C toplamalı yaklaşımı tarafından alınan eylemi temsil eder. Terminolojiyi basitleştirmek için, bu eylemi drift-plus-ceza eylemi, Yerine C-katkılı yaklaşık sürüklenme artı ceza eylemi. İzin Vermek temsil etmek -yalnızca karar:

Drift artı ceza eylemini varsayalım her yuvada kullanılır. (Denklem 2) ile, bunun altındaki sürüklenme artı ceza ifadesi eylem, her alan için aşağıdakileri karşılar

son eşitsizliğin geldiği yer, çünkü eylem bir katkı sabiti içinde gelir önceki ifadeyi kümedeki diğer tüm eylemlere göre küçültme dahil olmak üzere Yukarıdaki eşitsizliğin beklentilerini almak şunları verir:

Dikkat edin eylem hiçbir zaman gerçekten uygulanmadı. Varlığı, nihai eşitsizliğe ulaşmak için yalnızca karşılaştırma amacıyla kullanılmıştır. Yukarıdaki eşitsizliği ilki üzerinden toplamak slotlar şunları verir:

Yukarıdakileri bölerek tüm slotlar için geçerli olan aşağıdaki sonucu verir

Böylece, zaman ortalamalı beklenen ceza keyfi olarak optimal değere yakın yapılabilir. seçerek uygun büyüklükte. Tüm sanal kuyrukların ortalama hızda kararlı olduğu ve böylece istenen tüm kısıtlamaların karşılandığı gösterilebilir.[5] Parametre zaman ortalamalı kısıtlama fonksiyonlarının pozitif olmayan bir sayıya yakınsadığı hızı belirleyen kuyrukların boyutunu etkiler. Bir sonraki alt bölümde kuyrukların boyutuna ilişkin daha ayrıntılı bir analiz verilmektedir.

Ortalama sıra boyutu analizi

Şimdi var olduğunu varsayın -yalnızca politika (Eşitlik 3) - (Eşitlik 4) 'ü karşılayandan muhtemelen farklı, bazıları için aşağıdakileri karşılayan :

Önceki bölümdekine benzer bir argüman şunu gösterir:

Önceki bölümdekine benzer bir iç içe geçme serisi argümanı, böylece tüm t> 0 için aşağıdakileri göstermek için kullanılabilir:[5]

Bu, ortalama kuyruk boyutunun gerçekten O (V) olduğunu gösterir.

Olasılık 1 yakınsama

Yukarıdaki analiz, zaman ortalaması beklentilerini dikkate almaktadır. Sonsuz ufuk süresi ortalama kuyruk boyutu ve ceza için ilgili olasılık 1 performans sınırları, drift-plus-ceza yöntemi ile birlikte kullanılarak elde edilebilir. martingale teorisi.[14]

Sınırlı kapasiteye sahip kuyruklara uygulama

Gösterildiği gibi, drift-plus-cezası, ortalama kuyruk boyutunu V parametresinin seçimine bağlı olan belirli bir eşiğin altında tutmaya izin verir, ancak genel olarak maksimum kuyruk doluluğu konusunda herhangi bir garanti sunmaz. Bununla birlikte, eylem seti belirli kısıtlamalara uyuyorsa, bir kuyruğun maksimum uzunluğunu zorlamak için V seçimine ek bir koşul eklemek ve böylece algoritmayı sınırlı kapasiteli kuyruklara da uygulamak mümkündür.[15]

Kuyruk sistemlerinin tedavisi

Yukarıdaki analiz, herhangi bir açık kuyruğu olmayan stokastik bir sistemde zaman ortalamalarının kısıtlı optimizasyonunu dikkate alır. Her seferinde ortalama eşitsizlik kısıtlaması (Denklem 1) 'e göre sanal bir kuyruğa eşlendi. Bir kuyruk ağının optimize edilmesi durumunda, (Denklem 1) 'deki sanal kuyruk denklemleri gerçek kuyruk denklemleri ile değiştirilir.

Zaman ortalamalarının dışbükey fonksiyonları

Bununla ilgili bir sorun, aşağıdaki gibi kısıtlamalara tabi olan zaman ortalamalarının dışbükey bir fonksiyonunun en aza indirilmesidir:

nerede ve vardır dışbükey fonksiyonlar ve zaman ortalamalarının tanımlandığı yer:

Zaman ortalamalarının dışbükey işlevlerini optimize etmenin bu tür sorunları, işlevlerin zaman ortalamalarını optimize etme sorunlarına dönüştürülebilir. yardımcı değişkenler (Neely ders kitabının 5. Bölümüne bakın).[2][5] Sonraki sorunlar daha sonra önceki alt bölümlerde açıklandığı gibi sürüklenme artı ceza yöntemi ile çözülebilir. Bir alternatif ilkel yöntem, drift-plus-ceza kararlarına benzer kararlar alır, ancak amaç fonksiyonunun kısmi türevleri ile tanımlanan bir ceza kullanır [5][16][17] Primal-dual yaklaşım, aşağıdaki durumlarda yerel optimayı bulmak için de kullanılabilir. dışbükey değildir.[5]

Ödünleşmeleri ve ilgili işleri geciktirme

Önceki bölümdeki matematiksel analiz, sürüklenme artı ceza yönteminin O (1 /V) optimallik, karşılık gelen Ö(V) ortalama kuyruk boyutunda değiş tokuş. Bu yöntem, Ö(1/V), Ö(V) tradeoff, Neely'de geliştirildi[9] ve Neely, Modiano, Li[2] kararlılığa tabi olan ağ yardımcı programını maksimize etme bağlamında.

Ağ hizmetini maksimize etmek için ilgili bir algoritma Eryılmaz ve Srikant tarafından geliştirilmiştir.[18]Eryılmaz ve Srikant çalışması, drift-plus-ceza algoritmasına çok benzer bir algoritma ile sonuçlandı, ancak farklı bir analitik teknik kullandı. Bu teknik dayanıyordu Lagrange çarpanları. Lagrange çarpanı tekniğinin doğrudan kullanımı, daha kötü bir ödünleşime neden olur. Ö(1/V), Ö(V2). Bununla birlikte, Lagrange çarpan analizi, orijinali kurtarmak için daha sonra Huang ve Neely tarafından güçlendirildi. Ö(1/V), Ö(V), sıra boyutlarının, karşılık gelen deterministik optimizasyon probleminin Lagrange çarpanı etrafında sıkı bir şekilde kümelendiğini gösterirken, ödünleşmeler.[19]Bu kümeleme sonucu, iyileştirmeyi etkinleştirmek için sürüklenme artı ceza algoritmasını değiştirmek için kullanılabilir. Ö(1/V), Ö(günlük2(V)) ödünleşimler. Değişiklikler her ikisini de kullanabilir yer tutucu biriktirme listesi[19] veya Son Giren İlk Çıkar (LIFO) planlama.[20][21]

Stokastik olmayan işlevler için uygulandığında, drift-plus-ceza yöntemi, ikili alt gradyan yöntemi nın-nin dışbükey optimizasyon teorisi çıktısının bir zaman ortalaması olması dışında ilk değişkenler, ilk değişkenlerin kendileri yerine.[4][6] İlgili ilkel ikili teknik Stokastik bir kuyruk ağında faydayı maksimize etmek için, akışkan modeli analizi kullanılarak Stolyar tarafından geliştirilmiştir.[16][17]Stolyar analizi, yardımcı program ve kuyruk boyutu arasındaki performans değiş tokuşu için analitik sonuçlar sağlamaz. Stokastik ağlar için primal-dual yöntemin daha sonraki bir analizi, benzer bir O (1 / V), O (V) yardımcı programı ve kuyruk boyutu değiş tokuşunu kanıtlar ve aynı zamanda, zaman ortalamalarının dışbükey olmayan fonksiyonlarını en aza indirmek için yerel optimallik sonuçlarını gösterir. ek yakınsama varsayımı.[5] Bununla birlikte, bu analiz, zaman ortalamalarının sonsuz ufuk sınırlarına yakın bir şeye yakınsaması için ne kadar zaman gerektiğini belirtmez. Kuyruklar olmadan yardımcı program maksimizasyonu için ilgili primal-dual algoritmalar Agrawal ve Subramanian tarafından geliştirilmiştir.[22]ve Kushner ve Whiting.[23]

İ.i.d olmayan uzantılar. olay süreçleri

Sürüklenme artı ceza algoritmasının daha genel ergodik süreçler için benzer performans garantileri sağladığı bilinmektedir. , böylece i.i.d. varsayım, analiz için çok önemli değildir. Algoritmanın olasılıklarda ergodik olmayan değişikliklere karşı sağlam olduğu gösterilebilir. . Bazı senaryolarda, istenen analitik garantileri sağladığı gösterilebilir. evrensel çizelgeleme garantileri, keyfi için süreçler.[5]

Değişken çerçeve uzunluğu sistemlerine uzatmalar

Sürüklenme artı ceza yöntemi, değişken boyutlu çerçeveler üzerinde çalışan sistemleri tedavi etmek için genişletilebilir.[24][25] Bu durumda, çerçeveler indislerle etiketlenir r {0, 1, 2, ...} ve çerçeve süreleri {T[0], T[1], T[2], ...}, nerede T[r], her kare için negatif olmayan bir gerçek sayıdırr. İzin Vermek ve çerçeve arasında sürüklenmek r ve r + 1 ve çerçeve sırasında alınan toplam cezar, sırasıyla. Genişletilmiş algoritma, koşullu beklentilerin aşağıdaki oranındaki bir sınırı en aza indirmek için her çerçeve r üzerinde bir kontrol eylemi gerçekleştirir:

nerede Q[r], karenin başındaki kuyruk biriktirme listelerinin vektörüdürr. Tüm çerçevelerin aynı boyutta olduğu ve 1 yuva uzunluğuna normalleştirildiği özel durumda, T[r] = 1 hepsi için ryukarıdaki en aza indirme, standart drift-plus-ceza tekniğine indirgenir. Bu çerçeve tabanlı yöntem, kısıtlı optimizasyon için kullanılabilir. Markov karar sorunları (MDP'ler) ve deneyimlenen sistemleri içeren diğer sorunlar için yenilemeler.[24][25]

Dışbükey programlamaya uygulama

İzin Vermek x = (x1, ..., xN) fasulye Ngerçek sayıların boyutlu vektörü ve hiper dikdörtgeni tanımlama Bir tarafından:

nerede xmin, ben, xmax, ben tatmin eden gerçek sayılar verilir hepsi içinben. İzin Vermek P(x) ve {1, ... içindeki i için K} sürekli olun ve dışbükey fonksiyonlar of x her şeyin üzerinde vektör x içindeBir. Aşağıdakileri göz önünde bulundur dışbükey programlama sorun:

Bu, drift-plus-ceza yöntemiyle şu şekilde çözülebilir: Rastgele olay süreci içermeyen deterministik bir sistemin özel durumunu düşünün . Kontrol eylemini tanımlayın gibi:

ve eylem alanını şu şekilde tanımlayın: Nboyutlu hiper dikdörtgen Bir. Ceza ve kısıtlama işlevlerini şu şekilde tanımlayın:

Aşağıdaki zaman ortalamalarını tanımlayın:

Şimdi aşağıdaki zaman ortalamalı optimizasyon problemini düşünün:

Tarafından Jensen'in eşitsizliği aşağıdaki tüm slotlar t> 0 için geçerlidir:

Buradan, zaman-ortalama problemine (Denklem 8) - (Denklem 9) optimal bir çözümün, tüm t slotları için x (t) = x * tipi çözümlerle elde edilebileceği gösterilebilir, burada x * konveks programı (Denklem 6) - (Denklem 7) çözen bir vektördür. Ayrıca, herhangi bir zaman ortalamalı vektör zaman ortalamalı problemin bir çözümüne karşılık gelen (Denklem 8) - (Denklem 9) konveks programı (Eşitlik 6) - (Eşitlik 7) çözmelidir. Bu nedenle orijinal dışbükey program (Eşitlik 6) - (Eşitlik 7), ilgili zamana sürüklenme artı ceza algoritması uygulandığında alınan kararların zaman ortalamasını alarak (istenen herhangi bir doğruluk dahilinde) çözülebilir. ortalama problem (Eşitlik 8) - (Eşitlik 9). Problem için sürüklenme artı ceza algoritması (Denklem 8) - (Denklem 9) aşağıdakilere indirgenir:

Konveks programlama için drift-plus-ceza algoritması

Her yuva tvektör seç ifadeyi en aza indirmek için:

Ardından kuyrukları şuna göre güncelleyin:

Ortalama zaman vektörü dışbükey programa bir O (1 / V) yaklaşımına yakınsar.[6]

Bu algoritma standarda benzer ikili alt gradyan algoritması optimizasyon teorisinin sabit bir 1 / V adım boyutu kullanarak.[26] Bununla birlikte, temel bir fark, ikili alt gradyan algoritmasının tipik olarak aşağıdakiler için gerekli olan kısıtlayıcı katı dışbükeylik varsayımları altında analiz edilmesidir. ilk değişkenler x(t) yakınsamak için. Bu değişkenlerin optimal çözüme yakınsamadığı ve asla optimal çözüme yaklaşamadığı birçok önemli durum vardır (çoğu durumda bu böyledir) doğrusal programlar, Aşağıda gösterildiği gibi). Öte yandan, sürüklenme artı ceza algoritması katı dışbükeylik varsayımları gerektirmez. Sağlar zaman ortalamaları ilkellerin Ö(1/V) ile optimallik Ö(V) kuyruk boyutlarına ilişkin sınırlar (bunun bir Ö(V2) yakınsama süresine bağlı).[6]

Doğrusal programlama için drift artı ceza algoritması

Özel durumunu düşünün doğrusal program. Özellikle varsayalım:

gerçek değerli sabitler için (c1, …, cN), (aiçinde), (b1, …, bK). Daha sonra yukarıdaki algoritma aşağıdakine indirgenir: Her yuva t ve her değişken için n {1,… içinde N}, Seç xn(t) içinde [xmin,n, xmax,n] ifadeyi küçültmek için:

Ardından sıraları güncelleyin Qben(t) eskisi gibi. Bu, her bir değişkeni seçmek anlamına gelir xben(t) göre basit bang-bang kontrol politikası:

İlk değişkenlerden beri xben(t) her zaman ikisidir xmin,ben veya xmax,ben, eğer optimal çözüm hiper dikdörtgenin köşe noktası değilse, asla optimal çözüme yakınsamazlar. Bir. Ancak zaman ortalamaları bu patlama-patlama kararlarından Ö(1/V) optimal çözümün yaklaşıklığı. Örneğin, varsayalım ki xmin, 1 = 0, xmaks, 1 = 1 ve doğrusal programa yönelik tüm optimal çözümlerin x1 = 3/4. İlk değişken için patlama-patlama kararının kabaca 3 / 4'ü x1(t) = 1 ve kalan süre x1(t) = 0.[7]

İlgili Bağlantılar

Referanslar

  1. ^ a b M. J. Neely, "Zamanla Değişen Kablosuz Ağlar için Optimum Enerji Kontrolü, "Bilgi Teorisi üzerine IEEE İşlemleri, cilt 52, no. 7, s. 2915–2934, Temmuz 2006.
  2. ^ a b c d M. J. Neely, E. Modiano ve C. Li, "Heterojen Ağlar için Adillik ve Optimal Stokastik Kontrol, "Proc. IEEE INFOCOM, Mart 2005.
  3. ^ a b L. Tassiulas ve A. Ephremides, "Kısıtlı Kuyruklama Sistemlerinin Kararlılık Özellikleri ve MultihopRadio Ağlarında Maksimum Verim için Zamanlama Politikaları, Otomatik Kontrolde IEEE İşlemleri, cilt. 37, hayır. 12, s. 1936–1948, Aralık 1992.
  4. ^ a b c L. Georgiadis, M. J. Neely ve L. Tassiulas "Kablosuz Ağlarda Kaynak Tahsisi ve Katmanlar Arası Kontrol,"Ağ Kurmadaki Temeller ve Eğilimler, cilt. 1, hayır. 1, s. 1-149, 2006.
  5. ^ a b c d e f g h ben j k l m n Ö p q M. J. Neely.İletişim ve Kuyruk Sistemlerine Uygulama ile Stokastik Ağ Optimizasyonu,Morgan ve Claypool, 2010.
  6. ^ a b c d M. J. Neely, "[Bağlanmış İşlemciler Ağı Üzerinden Dağıtılmış ve Güvenli Dışbükey Programların Bir Bağlı İşlemciler Ağı Üzerinden Dışbükey Programların Güvenli Hesaplanması]," DCDIS Conf, Guelph, Ontario, Temmuz 2005
  7. ^ a b S. Supittayapornpong ve M. J. Neely, "Tamamen Ayrılabilir Karesel Politika ile Kablosuz Ağlar için Bilgi Kalitesi Maksimizasyonu, "arXiv: 1211.6162v2, Kasım 2012.
  8. ^ L. Tassiulas and A. Ephremides, "Dynamic Server Allocation to Parallel Queues with Randomly Varying Connectivity," IEEE Transactions on Information Theory, vol. 39, hayır. 2, pp. 466–478, March 1993.
  9. ^ a b M. J. Neely. Dynamic Power Allocation and Routing for Satellite and Wireless Networks with Time Varying Channels. Doktora Dissertation, Massachusetts Institute of Technology, LIDS. Kasım 2003.
  10. ^ R. Urgaonkar, B. Urgaonkar, M. J. Neely, A. Sivasubramaniam, "Optimal Power Cost Management Using Stored Energy in Data Centers," Proc. SIGMETRICS 2011.
  11. ^ M. Baghaie, S. Moeller, B. Krishnamachari, "Energy Routing on the Future Grid: A Stochastic Network Optimization Approach," Proc. International Conf. on Power System Technology (POWERCON), Oct. 2010.
  12. ^ M. J. Neely, A. S. Tehrani, and A. G. Dimakis, "Efficient Algorithms for Renewable Energy Allocation to Delay Tolerant Consumers," 1st IEEE International Conf. on Smart Grid Communications, 2010.
  13. ^ M. J. Neely and L. Huang, "Dynamic Product Assembly and Inventory Control for Maximum Profit," Proc. IEEE Conf. on Decision and Control, Atlanta, GA, Dec. 2010.
  14. ^ M. J. Neely, "Queue Stability and Probability 1 Convergence via Lyapunov Optimization," Journal of Applied Mathematics, vol. 2012, doi:10.1155/2012/831909.
  15. ^ L. Bracciale, P. Loreti "Lyapunov drift-plus-penalty optimization for queues with finite capacity" IEEE Communications Letters, doi:10.1109/LCOMM.2020.3013125.
  16. ^ a b A. Stolyar,"Maximizing Queueing Network Utility subject to Stability: Greedy Primal-Dual Algorithm," Queueing Systems, cilt. 50, hayır. 4, pp. 401–457, 2005.
  17. ^ a b A. Stolyar, "Greedy Primal-Dual Algorithm for Dynamic Resource Allocation in Complex Networks," Queueing Systems, vol. 54, no. 3, pp. 203–220, 2006.
  18. ^ A. Eryilmaz and R. Srikant, "Fair Resource Allocation in Wireless Networks using Queue-Length-Based Schedulingand Congestion Control," Proc. IEEE INFOCOM, March 2005.
  19. ^ a b L. Huang and M. J. Neely, "Delay Reduction via Lagrange Multipliers in Stochastic Network Optimization," IEEE Trans. on Automatic Control, vol. 56, no. 4, pp. 842–857, April 2011.
  20. ^ S. Moeller, A. Sridharan, B. Krishnamachari, and O. Gnawali, "Routing without Routes: The Backpressure Collection Protocol," Proc. IPSN 2010.
  21. ^ L. Huang, S. Moeller, M. J. Neely, and B. Krishnamachari, "LIFO-Backpressure Achieves Near Optimal Utility-Delay Tradeoff," IEEE/ACM Transactions on Networking, to appear.
  22. ^ R. Agrawal and V. Subramanian, "Optimality of certain channel aware scheduling policies," Proc. 40th Annual Allerton Conf. on Communication, Control, and Computing, Monticello, IL, Oct. 2002.
  23. ^ H. Kushner and P. Whiting, "Asymptotic Properties of Proportional-Fair Sharing Algorithms," Proc. 40th Annual Allerton Conf. on Communication, Control, and Computing, Monticello, IL, Oct. 2002.
  24. ^ a b C. Li and M. J. Neely, "Network utility maximization over partially observable Markovian channels," Performance Evaluation, https://dx.doi.org/10.1016/j.peva.2012.10.003.
  25. ^ a b M. J. Neely, "Dynamic Optimization and Learning for Renewal Systems," IEEE Transactions on Automatic Control, vol. 58, no. 1, pp. 32–46, Jan. 2013.
  26. ^ D. P. Bertsekas and A. Nedic and A. E. Ozdaglar. Convex Analysis and Optimization, Boston: Athena Scientific, 2003.

Birincil kaynaklar

  • M. J. Neely. Stochastic Network Optimization with Application to Communication and Queueing Systems, Morgan & Claypool, 2010.