Stokastik kontrol - Stochastic control

Stokastik kontrol veya stokastik optimal kontrol alt alanı kontrol teorisi ya gözlemlerdeki ya da sistemin evrimini yönlendiren gürültüdeki belirsizliğin varlığıyla ilgilenir. Sistem tasarımcısı, bir Bayes olasılığı güdümlü moda, bilinen olasılık dağılımına sahip rastgele gürültünün durum değişkenlerinin gelişimini ve gözlemini etkilediği. Stokastik kontrol, bu gürültünün varlığına rağmen, bir şekilde tanımlanan minimum maliyetle istenen kontrol görevini gerçekleştiren kontrollü değişkenlerin zaman yolunu tasarlamayı amaçlamaktadır.[1] Bağlam aşağıdakilerden biri olabilir ayrık zaman veya sürekli zaman.

Kesinlik denkliği

Stokastik kontrolde son derece iyi çalışılmış bir formülasyon, doğrusal ikinci dereceden Gauss kontrolü. Burada model doğrusaldır, amaç işlevi ikinci dereceden bir formun beklenen değeridir ve rahatsızlıklar tamamen toplamadır. Yalnızca toplamsal belirsizlik içeren ayrık zamanlı merkezileştirilmiş sistemler için temel bir sonuç, kesinlik denkliği özelliği:[2] bu durumda optimal kontrol çözümünün, ilave parazitlerin yokluğunda elde edilecek olanla aynı olduğu. Bu özellik, doğrusal evrim denklemleri, ikinci dereceden maliyet fonksiyonu ve modele yalnızca ek olarak giren gürültüye sahip tüm merkezi sistemler için geçerlidir; ikinci dereceden varsayım, kesinlik-eşdeğerlik özelliğini izleyen optimal kontrol yasalarının, kontrolörlerin gözlemlerinin doğrusal fonksiyonları olmasına izin verir.

Yukarıdaki varsayımlardan herhangi bir sapma - doğrusal olmayan bir durum denklemi, ikinci dereceden olmayan bir amaç fonksiyonu, çarpımsal parametrelerde gürültü modelin veya kontrolün merkezsizleştirilmesi - kesinlik denkliği özelliğinin geçerli olmamasına neden olur. Örneğin, ademi merkeziyetçi kontrol için sahip olamaması, Witsenhausen'in karşı örneği.

Ayrık zaman

Ayrık bir zaman bağlamında, karar verici, her bir zaman periyodunda muhtemelen gözlem gürültüsüyle durum değişkenini gözlemler. Amaç, doğrusal olmayan (muhtemelen ikinci dereceden) bir amaç fonksiyonunun beklenen değerlerinin toplamını mevcut durumdan son endişe dönemine kadar tüm zaman periyotları boyunca optimize etmek veya hedef fonksiyonun değerini yalnızca son dönemden itibaren optimize etmek olabilir. . Her zaman diliminde yeni gözlemler yapılır ve kontrol değişkenleri en uygun şekilde ayarlanmalıdır. Şimdiki zaman için en uygun çözümü bulmak, bir şeyi yinelemeyi içerebilir. matris Riccati denklemi geçmiş dönemden şimdiki döneme kadar zamanda geriye doğru.

Geçiş matrisindeki parametre değerleri (durum değişkenlerinin mevcut değerlerinin kendi evrimi üzerindeki etkisini verir) ve / veya durum denkleminin kontrol yanıtı matrisi hakkında belirsizliğin olduğu, ancak yine de doğrusal bir durumda olan ayrık zamanlı durumda denklem ve ikinci dereceden amaç fonksiyonu için bir Riccati denklemi, kesinlik denkliği uygulanmasa bile her dönemin çözümüne geriye doğru yinelemek için hala elde edilebilir.[2]ch.13[3] İkinci dereceden olmayan bir kayıp fonksiyonunun ayrık zamanlı durumu, ancak daha fazla komplikasyonla da olsa, yalnızca ek bozukluklar da ele alınabilir.[4]

Misal

Ayrık zamanlı stokastik doğrusal kuadratik kontrol probleminin tipik bir özelliği,[2]:ch. 13;[3][5]

nerede E1 ... beklenen değer operatör koşullu y0, üst simge T gösterir matris devrik, ve S zaman ufku, durum denklemine tabidir

nerede y bir n × 1 gözlemlenebilir durum değişkenleri vektörü, sen bir k × 1 kontrol değişkenleri vektörü, Birt zamanı t gerçekleşmesi stokastik n × n durum geçiş matrisi, Bt zamanı t stokastik gerçekleşmesi n × k kontrol çarpanları matrisi ve Q (n × n) ve R (k × k) bilinen simetrik pozitif tanımlı maliyet matrisleridir. Her bir öğenin Bir ve B ortaklaşa bağımsız ve aynı şekilde zamanla dağıtıldığından, beklenen değer işlemlerinin zaman koşullu olması gerekmez.

Zamanda geriye doğru indüksiyon her seferinde optimum kontrol çözümünü elde etmek için kullanılabilir,[2]:ch. 13

simetrik pozitif kesin maliyet matrisi ile X zamanda geriye doğru gelişen göre

Bu problemin ayrık zamanlı dinamik Riccati denklemi olarak bilinen. Bilinmeyen parametrelerle ilgili gerekli olan tek bilgi Bir ve B matrisler, her bir matrisin her bir öğesinin beklenen değeri ve varyansı ve aynı matrisin öğeleri arasındaki ve matrisler arasındaki öğeler arasındaki kovaryanslardır.

Optimal kontrol çözümü, sıfır ortalamalı ise, i.i.d. etkilenmez. Katkı şokları, durum denkleminde de, parametrelerle ilintisiz oldukları sürece görülür. Bir ve B matrisler. Ancak bu kadar korelasyonluysa, o zaman her periyot için optimal kontrol çözümü ek bir toplamsal sabit vektör içerir. Durum denkleminde ilave bir sabit vektör belirirse, yine her periyot için optimal kontrol çözümü ilave bir toplamsal sabit vektör içerir.

Kararlı durum karakterizasyonu X (eğer varsa), içinde sonsuz ufuk problemi ile ilgilidir. S sonsuza gider, dinamik denklemi yineleyerek bulunabilir X yakınlaşana kadar tekrar tekrar; sonra X zaman alt simgelerinin dinamik denkleminden çıkarılmasıyla karakterize edilir.

Sürekli zaman

Model sürekli zaman içindeyse, denetleyici her an sistemin durumunu bilir. Amaç, örneğin sıfır zamandan (şimdiki zaman) bir uç zamana kadar bir ufuk üzerinde bir durum değişkeninin bir içbükey fonksiyonunun bir integralini maksimize etmektir. Tveya gelecekteki bir tarihte bir durum değişkeninin içbükey işlevi T. Zaman ilerledikçe, sürekli olarak yeni gözlemler yapılır ve kontrol değişkenleri sürekli olarak optimum şekilde ayarlanır.

Stokastik model tahmini kontrol

Literatürde, stokastik sistemler için iki tür MPC vardır; Sağlam model öngörülü kontrol ve Stokastik Model Öngörülü Kontrol (SMPC). Sağlam model tahmini kontrolü, optimizasyon prosedüründeki en kötü senaryoyu dikkate alan daha muhafazakar bir yöntemdir. Ancak, diğer güçlü kontrollere benzer şekilde bu yöntem, genel kontrolör performansını bozar ve ayrıca yalnızca sınırlı belirsizlikleri olan sistemler için geçerlidir. Alternatif yöntem olan SMPC, olasılıksal bir eşitsizlikle ihlal riskini sınırlayan yumuşak kısıtlamaları dikkate alır.[6]

Finans alanında

Sürekli bir zaman yaklaşımında finans bağlamda, stokastik diferansiyel denklemdeki durum değişkeni genellikle servet veya net değerdir ve kontroller, çeşitli varlıklara her seferinde yerleştirilen hisselerdir. Verilen varlık tahsisi herhangi bir zamanda seçildiğinde, servetteki değişimin belirleyicileri genellikle varlıkların stokastik getirileri ve risksiz varlığın faiz oranıdır. Stokastik kontrol alanı, özellikle finans uygulamalarında, 1970'lerden beri büyük ölçüde gelişmiştir. Robert Merton çalışmak için stokastik kontrolü kullandı optimal portföyler güvenli ve riskli varlıklar.[7] Onun işi ve bu Siyah okullar doğasını değiştirdi finans Edebiyat. Etkili matematiksel ders kitabı incelemeleri Fleming ve Rishel,[8] ve Fleming tarafından ve Soner.[9] Bu teknikler tarafından uygulandı Stein için 2007-08 mali krizi.[10]

Bir terminal tarihinde net değerin beklenen logaritmasının maksimizasyonu T, servetin bileşenleri üzerinde stokastik süreçlere tabidir.[11] Bu durumda, sürekli zamanda Itô denklemi analizin ana aracıdır. Maksimizasyonun, bir ufuk üzerindeki bir içbükey fayda fonksiyonunun bir ayrılmaz parçası olduğu durumda (0,T) dinamik programlama kullanılır. Daha eski literatürdeki gibi kesin bir eşdeğerlik yoktur, çünkü kontrol değişkenlerinin katsayıları - yani, seçilen varlık hisselerinin aldığı getiriler - stokastiktir.

Ayrıca bakınız

Referanslar

  1. ^ Answers.com'dan Tanım
  2. ^ a b c d Chow Gregory P. (1976). Dinamik Ekonomik Sistemlerin Analizi ve Kontrolü. New York: Wiley. ISBN  0-471-15616-7.
  3. ^ a b Turnovsky Stephen (1976). "Stokastik Doğrusal Sistemler İçin Optimal Stabilizasyon Politikaları: İlişkili Çarpmalı ve Toplamsal bozukluklar Durumu". Ekonomik Çalışmaların Gözden Geçirilmesi. 43 (1): 191–94. doi:10.2307/2296614. JSTOR  2296614.
  4. ^ Mitchell, Douglas W. (1990). "Yaklaşık Beklenen Faydaya Dayalı İzlenebilir Riske Duyarlı Kontrol". Ekonomik Modelleme. 7 (2): 161–164. doi:10.1016 / 0264-9993 (90) 90018-Y.
  5. ^ Turnovsky, Stephen (1974). "Optimal ekonomi politikalarının istikrar özellikleri". Amerikan Ekonomik İncelemesi. 64 (1): 136–148. JSTOR  1814888.
  6. ^ Hashemian; Armaou (2017). "İki Bileşenli Granülasyon İşlemi için Stokastik MPC Tasarımı". IEEE Bildirileri: 4386–4391. arXiv:1704.04710. Bibcode:2017arXiv170404710H.
  7. ^ Merton, Robert (1990). Sürekli Zaman Finansmanı. Blackwell.
  8. ^ Fleming, W .; Rishel, R. (1975). Deterministik ve Stokastik Optimal Kontrol. ISBN  0-387-90155-8.
  9. ^ Fleming, W .; Soner, M. (2006). Kontrollü Markov Süreçleri ve Viskozite Çözümleri. Springer.
  10. ^ Stein, J.L. (2012). Stokastik Optimal Kontrol ve ABD Mali Krizi. Springer-Bilim.
  11. ^ Barreiro-Gomez, J .; Tembine, H. (2019). "Blockchain Token Ekonomisi: Ortalama Alan Tipi Bir Oyun Perspektifi". IEEE Erişimi. 7: 64603–64613. doi:10.1109 / ERİŞİM.2019.2917517. ISSN  2169-3536.

daha fazla okuma

  • Dixit, Avinash (1991). "Brownian Hareketinin Optimal Düzenleme Teorisinin Basitleştirilmiş Bir İncelemesi". Ekonomik Dinamikler ve Kontrol Dergisi. 15 (4): 657–673. doi:10.1016/0165-1889(91)90037-2.
  • Yong, Jiongmin; Zhou, Xun Yu (1999). Stokastik Kontroller: Hamilton Sistemleri ve HJB Denklemleri. New York: Springer. ISBN  0-387-98723-1.