Dinamik program - Dynamic programming

Şekil 1. Optimal alt yapıyı kullanarak bir grafikte en kısa yolu bulmak; düz bir çizgi tek bir kenarı belirtir; dalgalı bir çizgi bağlandığı iki köşe arasındaki en kısa yolu belirtir (diğer yollar arasında, aynı iki köşeyi paylaşan gösterilmemiştir); kalın çizgi, başlangıçtan hedefe kadar genel olarak en kısa yoldur.

Dinamik program hem bir matematiksel optimizasyon yöntem ve bir bilgisayar programlama yöntemi. Yöntem, Richard Bellman 1950'lerde ve çeşitli alanlarda uygulamalar bulmuştur. uzay Mühendisliği -e ekonomi.

Her iki bağlamda da karmaşık bir problemi, bir problemdeki daha basit alt problemlere bölerek basitleştirmeyi ifade eder. yinelemeli tavır. Bazı karar problemleri bu şekilde parçalara ayrılamazken, zaman içinde birkaç noktayı kapsayan kararlar genellikle yinelemeli olarak parçalanır. Benzer şekilde, bilgisayar biliminde, bir problem en iyi şekilde alt problemlere bölünerek çözülebilirse ve daha sonra alt problemlere en uygun çözümleri tekrar tekrar bularak çözülebilirse, optimal altyapı.

Alt problemler, dinamik programlama yöntemlerinin uygulanabilir olması için, daha büyük problemlerin içinde özyinelemeli olarak yuvalanabiliyorsa, o zaman daha büyük problemin değeri ile alt problemlerin değerleri arasında bir ilişki vardır.[1] Optimizasyon literatüründe bu ilişkiye Bellman denklemi.

Genel Bakış

Matematiksel optimizasyon

Matematiksel optimizasyon açısından, dinamik programlama genellikle bir kararı zaman içinde bir dizi karar adımına bölerek basitleştirmeyi ifade eder. Bu, bir dizi tanımlayarak yapılır değer fonksiyonları V1, V2, ..., Vn alma y temsil eden bir argüman olarak durum zaman zaman sistemin ben 1'den n. Tanımı Vn(y) durumda elde edilen değerdir y son seferde n. Değerler Vben daha erken zamanlarda ben = n −1, n - 2, ..., 2, 1, bir kullanarak geriye doğru çalışarak bulunabilir. yinelemeli ilişki denen Bellman denklemi. İçin ben = 2, ..., n, Vben−1 herhangi bir durumda y hesaplanır Vben zamanındaki bir karardan elde edilen kazancın basit bir işlevini (genellikle toplamı) maksimize ederek ben - 1 ve işlev Vben Sistemin yeni durumunda bu karar verilirse. Dan beri Vben gerekli durumlar için zaten hesaplanmışsa, yukarıdaki işlem verimi Vben−1 bu eyaletler için. En sonunda, V1 sistemin ilk durumunda optimal çözümün değeridir. Karar değişkenlerinin optimal değerleri, halihazırda yapılmış olan hesaplamalar geriye dönük izlenerek teker teker kurtarılabilir.

Kontrol teorisi

İçinde kontrol teorisi tipik bir sorun, kabul edilebilir bir kontrol bulmaktır sisteme neden olan kabul edilebilir bir yörünge izlemek sürekli bir zaman aralığında en aza indiren maliyet fonksiyonu

Bu sorunun çözümü, optimal bir kontrol yasası veya politikasıdır optimal bir yörünge üreten ve bir maliyet işlevi . İkincisi, dinamik programlamanın temel denklemine uyar:

a kısmi diferansiyel denklem olarak bilinir Hamilton – Jacobi – Bellman denklemi içinde ve . Biri küçültmeyi bulur açısından , ve bilinmeyen işlev ve ardından sonucu Hamilton-Jacobi-Bellman denklemine koyar ve kısmi diferansiyel denklemin sınır koşuluyla çözülmesini sağlar .[2] Uygulamada, bu genellikle gerektirir sayısal teknikler kesin optimizasyon ilişkisine bazı ayrık yaklaşımlar için.

Alternatif olarak, sürekli süreç, Hamilton-Jacobi-Bellman denklemine benzer şekilde aşağıdaki tekrarlama ilişkisine yol açan ayrı bir sistemle yaklaşık olarak tahmin edilebilir:

-de -nci aşama eşit aralıklı ayrık zaman aralıkları ve nerede ve ayrık yaklaşımları gösterir ve . Bu fonksiyonel denklem olarak bilinir Bellman denklemi optimizasyon denkleminin ayrık yaklaşımının kesin çözümü için çözülebilir.[3]

Ekonomiden örnek: Ramsey'in optimal tasarruf sorunu

Ekonomide amaç, genellikle bazı dinamikleri maksimize etmektir (en aza indirmek yerine). sosyal refah işlevi. Ramsey probleminde, bu işlev tüketim miktarlarını aşağıdaki düzeylerle ilişkilendirir. Yarar. Kabaca konuşursak, planlayıcı çağdaş tüketim ile gelecekteki tüketim arasındaki değiş tokuşla yüzleşir (yatırım yoluyla sermaye stoku üretimde kullanılan) olarak bilinir zamanlar arası seçim. Gelecek tüketim sabit bir oranda iskonto edilir . Sermayenin geçiş denklemine ayrı bir yaklaşım şu şekilde verilir:

nerede tüketimdir başkenttir ve bir üretim fonksiyonu tatmin edici Inada koşulları. İlk sermaye stoku varsayılmaktadır.

İzin Vermek dönem içinde tüketim olmak tve tüketim getirilerini varsayalım Yarar tüketici yaşadığı sürece. Tüketicinin sabırsız olduğunu varsayın, böylece indirimler faktöre göre gelecekteki fayda b her dönem, nerede . İzin Vermek olmak Başkent Dönem içinde t. Başlangıç ​​sermayesinin belirli bir miktar olduğunu varsayın ve bu dönemin sermaye ve tüketiminin bir sonraki dönemin sermayesini şu şekilde belirlediğini varsayalım: , nerede Bir pozitif bir sabittir ve . Sermayenin negatif olamayacağını varsayalım. Daha sonra tüketicinin karar problemi şu şekilde yazılabilir:

tabi hepsi için

Bu şekilde yazıldığında, sorun karmaşık görünüyor çünkü tüm seçim değişkenlerini çözmeyi içeriyor . (Başkent bir seçim değişkeni değildir - tüketicinin başlangıç ​​sermayesi verildiği gibi alınır.)

Bu sorunu çözmek için dinamik programlama yaklaşımı, onu daha küçük kararlar dizisine bölmeyi içerir. Bunu yapmak için bir dizi tanımlıyoruz değer fonksiyonları , için herhangi bir miktarda sermayeye sahip olmanın değerini temsil eden k her seferinde t. Ölümden sonra sermayeye sahip olmanın (varsayım gereği) hiçbir faydası yoktur, .

Herhangi bir sermaye miktarının önceki herhangi bir zamandaki değeri şu şekilde hesaplanabilir: geriye dönük kullanmak Bellman denklemi. Bu problemde her biri için Bellman denklemi

tabi

Bu problem daha önce yazdığımızdan çok daha basittir çünkü sadece iki karar değişkenini içerir, ve . Sezgisel olarak, doğumda tüm yaşam planını seçmek yerine, tüketici her seferinde bir adım atabilir. Zamanda tşimdiki başkenti verilir ve yalnızca mevcut tüketimi seçmesi gerekir ve tasarruf .

Bu sorunu gerçekten çözmek için geriye doğru çalışıyoruz. Basit olması için, mevcut sermaye seviyesi şu şekilde belirtilir: k. zaten biliniyor, dolayısıyla Bellman denklemini kullanarak ve biz gelene kadar , hangisi değer tüm yaşam boyunca ilk karar problemi. Başka bir deyişle, bildiğimizde hesaplayabiliriz , maksimum olan , nerede seçim değişkeni ve .

Geriye doğru çalışıldığında, değerin o anda çalıştığı gösterilebilir. dır-dir

her biri nerede sabittir ve zamanında tüketilecek en uygun miktardır dır-dir

basitleştirilebilir

Kişi yaşlandıkça mevcut servetin daha büyük bir kısmını tüketmenin ve nihayetinde kalan tüm serveti tüketmenin en uygun olduğunu görüyoruz. T, hayatın son dönemi.

Bilgisayar Programlama

Dinamik programlamanın uygulanabilir olması için bir problemin sahip olması gereken iki temel özellik vardır: optimal altyapı ve örtüşen alt problemler. Optimal çözümleri birleştirerek bir problem çözülebilirse örtüşmeyen alt problemler, stratejiye "böl ve fethet " yerine.[1] Bu nedenle sıralamayı birleştir ve hızlı sıralama dinamik programlama problemleri olarak sınıflandırılmaz.

Optimal alt yapı belirli bir optimizasyon probleminin çözümünün, alt problemlerine optimal çözümlerin kombinasyonu ile elde edilebileceği anlamına gelir. Bu tür optimal alt yapılar genellikle şu şekilde tanımlanır: özyineleme. Örneğin, bir grafik verildiğinde G = (V, E)en kısa yol p bir tepe noktasından sen bir tepe noktasına v optimal alt yapıyı sergiler: herhangi bir ara tepe noktasını alın w bu en kısa yolda p. Eğer p gerçekten en kısa yoldur, bu durumda alt yollara bölünebilir p1 itibaren sen -e w ve p2 itibaren w -e v Öyle ki bunlar, karşılık gelen köşeler arasındaki en kısa yollardır (basit kes ve yapıştır argümanıyla Algoritmalara Giriş ). Bu nedenle, en kısa yolları bulmak için çözümü özyinelemeli bir şekilde kolayca formüle edebilir, Bellman-Ford algoritması ya da Floyd – Warshall algoritması yapar.

Örtüşen alt problemler, alt problemlerin alanının küçük olması gerektiği anlamına gelir, yani problemi çözen herhangi bir özyinelemeli algoritma, yeni alt problemler oluşturmaktan ziyade aynı alt problemleri defalarca çözmelidir. Örneğin, Fibonacci serisini oluşturmak için yinelemeli formülasyonu düşünün: Fben = Fben−1 + Fben−2, temel kasa ile F1 = F2 = 1. Sonra F43F42 + F41, ve F42F41 + F40. Şimdi F41 her ikisinin de özyinelemeli alt ağaçlarında çözülüyor F43 Hem de F42. Toplam alt problem sayısı aslında küçük olsa da (sadece 43 tanesi), bunun gibi saf özyinelemeli bir çözüm benimsersek, aynı problemleri defalarca çözeriz. Dinamik programlama bu gerçeği hesaba katar ve her bir alt sorunu yalnızca bir kez çözer.

Şekil 2. Fibonacci dizisi için alt problem grafiği. Gerçeği bir ağaç örtüşen alt sorunları gösterir.

Bu, iki yoldan biriyle gerçekleştirilebilir:[kaynak belirtilmeli ]

  • Yukarıdan aşağıya yaklaşım: Bu, herhangi bir sorunun özyinelemeli formülasyonunun doğrudan düşüşüdür. Herhangi bir sorunun çözümü, alt problemlerinin çözümü kullanılarak özyinelemeli olarak formüle edilebiliyorsa ve alt problemleri örtüşüyorsa, o zaman kolayca hatırlamak veya alt problemlerin çözümlerini bir tabloda saklayın. Ne zaman yeni bir alt problemi çözmeye çalışsak, önce zaten çözülüp çözülmediğini görmek için tabloyu kontrol ederiz. Bir çözüm kaydedilmişse onu doğrudan kullanabiliriz, yoksa alt problemi çözer ve çözümünü tabloya ekleriz.
  • Aşağıdan yukarıya yaklaşım: Bir problemin çözümünü, alt problemleri açısından özyinelemeli olarak formüle ettikten sonra, problemi aşağıdan yukarıya bir tarzda yeniden formüle etmeyi deneyebiliriz: önce alt problemleri çözmeyi deneyin ve onların çözümlerini kullanarak üzerine inşa edip, daha büyük alt problemlere çözümler. Bu aynı zamanda genellikle küçük alt problemlerin çözümlerini kullanarak daha büyük ve daha büyük alt problemlere yinelemeli olarak çözümler üreterek tablo şeklinde yapılır. Örneğin, zaten değerlerini biliyorsak F41 ve F40doğrudan değerini hesaplayabiliriz F42.

Biraz Programlama dilleri otomatik olarak yapabilir hatırlamak hızlandırmak için belirli bir bağımsız değişken kümesiyle bir işlev çağrısının sonucu isimle arama değerlendirme (bu mekanizma şu şekilde anılır: ihtiyaca göre arama ). Bazı diller bunu taşınabilir bir şekilde mümkün kılar (ör. Şema, Ortak Lisp, Perl veya D ). Bazı dillerde otomatik hafızaya alma yerleşik, masalı gibi Prolog ve J ile not almayı destekleyen M. zarf.[4] Her durumda, bu yalnızca bir referans olarak şeffaf işlevi. Memoization, aynı zamanda, terim-yeniden yazma tabanlı dillerde kolayca erişilebilir bir tasarım modeli olarak karşımıza çıkar. Wolfram Dili.

Biyoinformatik

Dinamik programlama, biyoinformatikte aşağıdaki gibi görevler için yaygın olarak kullanılmaktadır. sıra hizalaması, protein katlanması, RNA yapısı tahmini ve protein-DNA bağlanması. Protein-DNA bağlanması için ilk dinamik programlama algoritmaları 1970'lerde bağımsız olarak geliştirildi. Charles DeLisi Amerika'da[5] SSCB'de Georgii Gurskii ve Alexander Zasedatelev.[6] Son zamanlarda bu algoritmalar biyoinformatik ve hesaplamalı biyolojide, özellikle de nükleozom konumlandırma ve transkripsiyon faktörü bağlayıcı.

Örnekler: Bilgisayar algoritmaları

Dijkstra'nın en kısa yol problemi için algoritması

Dinamik programlama bakış açısından, Dijkstra algoritması için en kısa yol problemi en kısa yol problemi için dinamik programlama fonksiyonel denklemini çözen ardışık bir yaklaşım şemasıdır. Ulaşıyor yöntem.[7][8][9]

Aslında, Dijkstra'nın algoritmanın arkasındaki mantığa ilişkin açıklaması,[10] yani

Problem 2. Verilen iki düğüm arasındaki minimum toplam uzunluk yolunu bulun ve .

Gerçeğini kullanıyoruz, eğer minimum yoldaki bir düğümdür -e , ikincisinin bilgisi, asgari yolun bilgisini ima eder. -e .

başka bir deyişle Bellman tanınmış Optimallik İlkesi bağlamında en kısa yol problemi.

Fibonacci Dizisi

Dinamik programlamanın hesaplanmasında nüye Fibonacci Dizisi performansını büyük ölçüde artırır. İşte doğrudan matematiksel tanıma dayanan naif bir uygulama:

   işlevi fib (n) Eğer n <= 1 dönüş n dönüş lif (n - 1) + lif (n - 2)

Dikkat edin, ararsak, fib (5), işlevi aynı değerde birçok farklı kez çağıran bir çağrı ağacı üretiriz:

  1. fib (5)
  2. lif (4) + lif (3)
  3. (iplik (3) + iplik (2)) + (iplik (2) + iplik (1))
  4. ((fib (2) + fib (1)) + (fib (1) + fib (0))) + ((fib (1) + fib (0)) + fib (1))
  5. (((fib (1) + fib (0)) + fib (1)) + (fib (1) + fib (0))) + ((fib (1) + fib (0)) + fib (1) )

Özellikle, fib (2) sıfırdan üç kez hesaplandı. Daha büyük örneklerde, çok daha fazla değer uydurmakveya alt problemler, yeniden hesaplanır ve üstel bir zaman algoritmasına yol açar.

Şimdi, varsayalım ki basit bir harita nesne, m, her bir değeri eşleyen uydurmak bu zaten sonucuna göre hesaplanmıştır ve işlevimizi kullanmak ve güncellemek için değiştiriyoruz. Ortaya çıkan işlev yalnızca Ö (n) üstel zaman yerine zaman (ancak şunu gerektirir: Ö (n) Uzay):

   var m: = harita(0 → 0, 1 → 1)   işlevi fib (n) Eğer anahtar n içinde değil harita m m [n]: = iplik (n - 1) + iplik (n - 2) dönüş m [n]

Zaten hesaplanmış olan değerleri kaydetme tekniğine denir. hafızaya alma; Bu yukarıdan aşağıya bir yaklaşımdır, çünkü önce problemi alt problemlere böleriz ve sonra değerleri hesaplar ve saklarız.

İçinde altüst yaklaşım, daha küçük değerleri hesaplıyoruz uydurmak önce, sonra onlardan daha büyük değerler oluşturun. Bu yöntem aynı zamanda O (n) n - 1 kez yinelenen bir döngü içerdiğinden süre, ancak O (yukarıdan aşağıya yaklaşımın tersine) yalnızca sabit (O (1)) alan alırn) haritayı saklamak için boşluk.

   işlevi fib (n) Eğer n = 0 dönüş 0       Başka           var previousFib: = 0, currentFib: = 1 tekrar et n - 1 zamanlar // n = 1 ise döngü atlanır               var newFib: = previousFib + currentFib previousFib: = currentFib currentFib: = newFib dönüş currentFib

Her iki örnekte de sadece hesaplıyoruz fib (2) bir kez ve sonra her ikisini de hesaplamak için kullanın fib (4) ve fib (3), her ikisi de değerlendirildiğinde onu hesaplamak yerine.

Yukarıdaki yöntem aslında alır zaman büyük n, çünkü iki tamsayının toplanması her birinin aldığı bitler zaman. (The ninci fibonacci numarası var bitler.) Ayrıca, Fibonacci dizisi için kapalı bir form vardır, Binet formülü olarak bilinir hangi -th terim olabilir hesaplanmış yaklaşık olarak Yukarıdaki dinamik programlama tekniğinden daha verimli olan zaman. Bununla birlikte, basit tekrar doğrudan verir matris formu yaklaşık olarak hızlı algoritma matris üssü.

Bir tür dengeli 0–1 matris

Bir nesnenin pozisyonlarına sıfır veya bir değer atama problemini düşünün. n × n matris, ile n hatta, her satır ve her sütun tam olarak n / 2 sıfırlar ve n / 2 olanlar. Belirli bir iş için kaç farklı görev olduğunu soruyoruz . Örneğin, ne zaman n = 4olası dört çözüm

En az üç olası yaklaşım vardır: kaba kuvvet, geri izleme ve dinamik programlama.

Kaba kuvvet, tüm sıfır ve bir atamalarını kontrol etmekten ve dengeli satır ve sütunlara sahip olanları saymaktan oluşur (n / 2 sıfırlar ve n / 2 olanlar). Olduğu gibi olası ödevler, bu strateji belki de .

Bu problem için geriye doğru izleme, matris elemanlarının bazı sıralarının seçilmesi ve yinelemeli olarak bir veya sıfırların yerleştirilmesinden oluşurken, her satır ve sütunda atanmamış eleman sayısı artı bir veya sıfır sayısının en azından her ikisinin de olduğunu kontrol eder. n / 2. Kaba kuvvetten daha sofistike olsa da, bu yaklaşım her çözümü bir kez ziyaret edecek ve bu durum için pratik olmayacaktır. n altıdan fazla, çünkü çözüm sayısı zaten 116.963.796.250 n = 8, göreceğimiz gibi.

Dinamik programlama, hepsini ziyaret etmeden çözümlerin sayısını saymayı mümkün kılar. İlk satır için geriye dönük değerleri hayal edin - her ilk satır değeri için elde edilen çözümleri doğru bir şekilde sayabilmek için kalan satırlar hakkında hangi bilgilere ihtiyaç duyarız? Düşünüyoruz ki k × n panolar, nerede 1 ≤ kn, kimin satırlar şunları içerir sıfırlar ve olanlar. İşlev f neye hafızaya alma uygulanmış haritalar vektörleri n kabul edilebilir panoların sayısına tam sayı çiftleri (çözümler). Her sütun için bir çift vardır ve iki bileşeni sırasıyla sıfırların ve o sütuna henüz yerleştirilmemiş olanların sayısını gösterir. Değerini arıyoruz ( argümanlar veya bir vektör elementler). Alt problem yaratma süreci, her birinin tekrarlanmasını içerir. panonun en üst satırı için olası atamalar ve her sütundan geçerek, üst satır için atamanın o konumda sıfır mı yoksa bir mi içerdiğine bağlı olarak, o sütun için çiftin uygun öğesinden bir tane çıkararak. Sonuçlardan herhangi biri olumsuzsa, atama geçersizdir ve çözüm kümesine katkıda bulunmaz (özyineleme durur). Aksi takdirde, sayfanın en üst satırı için bir atamamız var. k × n tahta ve kalan çözüm sayısını yinelemeli olarak hesaplayın (k − 1) × n yönetim kurulu, üst sıradaki her kabul edilebilir atama için çözüm numaralarını ekleyerek ve hafızaya alınan toplamı döndürür. Temel durum, bir için ortaya çıkan önemsiz alt problemdir. 1 × n yazı tahtası. Bu kart için çözüm sayısı, vektörün permütasyon olup olmadığına bağlı olarak sıfır veya birdir. n / 2 ve n / 2 çiftler ya da değil.

Örneğin, yukarıda gösterilen ilk iki panoda vektör dizileri şöyle olacaktır:

((2, 2) (2, 2) (2, 2) (2, 2)) ((2, 2) (2, 2) (2, 2) (2, 2)) k = 4 0 1 0 1 0 0 1 1 ((1, 2) (2, 1) (1, 2) (2, 1)) ((1, 2) (1, 2) (2, 1) (2, 1)) k = 3 1 0 1 0 0 0 1 1 ((1, 1) (1, 1) (1, 1) (1, 1)) ((0, 2) (0, 2) (2, 0) (2 , 0)) k = 2 0 1 0 1 1 1 0 0 ((0, 1) (1, 0) (0, 1) (1, 0)) ((0, 1) (0, 1) (1 , 0) (1, 0)) k = 1 1 0 1 0 1 1 0 0 ((0, 0) (0, 0) (0, 0) (0, 0)) ((0, 0) (0 , 0), (0, 0) (0, 0))

Çözüm sayısı (sıra A058527 içinde OEIS ) dır-dir

Dinamik programlama yaklaşımının MAPLE uygulamasına bağlantılar aşağıdakiler arasında bulunabilir: Dış bağlantılar.

Dama tahtası

Bir düşünün dama tahtası ile n × n kareler ve bir maliyet fonksiyonu c (i, j) kare ile ilişkili bir maliyet döndüren (i, j) (ben sıra olmak j sütun olmak). Örneğin (5 × 5 dama tahtasında),

567478
476114
335782
2670
1*5*
12345

Böylece c (1, 3) = 5

İlk sıradaki herhangi bir karede (yani sıra) başlayabilen bir pul olduğunu ve son sıraya ulaşmak için en kısa yolu (her ziyaret edilen sıralamadaki minimum maliyetlerin toplamı) bilmek istediğinizi varsayalım; pulun sadece çapraz olarak sola, çapraz olarak sağa veya düz ileri hareket edebileceğini varsayarsak. Yani bir dama (1,3) taşınabilir (2,2), (2,3) veya (2,4).

5
4
3
2xxx
1Ö
12345

Bu sorun, optimal altyapı. Yani, tüm problemin çözümü, alt problemlerin çözümlerine bağlıdır. Bir fonksiyon tanımlayalım q (i, j) gibi

q(ben, j) = kareye ulaşmanın minimum maliyeti (ben, j).

Rütbeden başlayarak n ve sıralamaya doğru azalan 1, her ardışık sıralamadaki tüm kareler için bu fonksiyonun değerini hesaplarız. Her sıralamada minimum değeri tutan kareyi seçmek bize sıralama arasındaki en kısa yolu verir n ve rütbe 1.

İşlev q (i, j) altındaki üç kareden herhangi birine ulaşmanın minimum maliyetine eşittir (çünkü bunlar ona ulaşabilen tek karelerdir) artı c (i, j). Örneğin:

5
4Bir
3BCD
2
1
12345

Şimdi tanımlayalım q (i, j) biraz daha genel terimlerle:

Bu denklemin ilk satırı, indekslenmiş kareler olarak modellenen bir pano ile ilgilidir. 1 en alt sınırda ve n en yüksek sınırda. İkinci satır, ilk sırada ne olacağını belirtir; bir temel durum sağlamak. Üçüncü satır, özyineleme, önemli kısımdır. Temsil eder A, B, C, D örnekteki terimler. Bu tanımdan, basit özyinelemeli kod türetebiliriz q (i, j). Aşağıdaki sözde kodda, n tahtanın boyutu, c (i, j) maliyet fonksiyonu ve dk () en az sayıda değeri döndürür:

işlevi minCost (i, j) Eğer j <1 veya j> n dönüş sonsuzluk Aksi takdirde i = 1 dönüş c (i, j) Başka        dönüş min(minCost (i-1, j-1), minCost (i-1, j), minCost (i-1, j + 1)) + c (i, j)

Bu işlev, gerçek yolu değil, yalnızca yol maliyetini hesaplar. Aşağıda gerçek yolu tartışıyoruz. Bu, Fibonacci sayıları örneğinde olduğu gibi, korkunç derecede yavaştır çünkü o da örtüşen alt problemler öznitelik. Yani, aynı yol maliyetlerini defalarca yeniden hesaplar. Ancak, yol maliyetlerini iki boyutlu bir dizide depolarsak, aşağıdan yukarıya bir şekilde bunu çok daha hızlı hesaplayabiliriz q [i, j] bir işlev kullanmak yerine. Bu, yeniden hesaplamayı önler; dizi için gerekli tüm değerler q [i, j] önceden yalnızca bir kez hesaplanır. İçin önceden hesaplanmış değerler (i, j) ihtiyaç duyulduğunda basitçe yukarı bakılır.

Ayrıca en kısa yolun ne olduğunu da bilmemiz gerekiyor. Bunu yapmak için başka bir dizi kullanıyoruz p [i, j]; a öncül dizi. Bu dizi herhangi bir kareye giden yolu kaydeder s. Selefi s endekse göre bir ofset olarak modellenmiştir ( q [i, j]) önceden hesaplanan yol maliyetinin s. Tam yolu yeniden inşa etmek için öncülünü ararız s, sonra o karenin öncülü, sonra o karenin selefi ve başlangıç ​​karesine ulaşana kadar özyinelemeli olarak devam eder. Aşağıdaki kodu göz önünde bulundurun:

 işlevi computeShortestPathArrays () için x itibaren 1 -e n q [1, x]: = c (1, x) için y itibaren 1 -e n q [y, 0]: = sonsuz q [y, n + 1]: = sonsuz için y itibaren 2 -e n için x itibaren 1 -e nm: = min (q [y-1, x-1], q [y-1, x], q [y-1, x + 1]) q [y, x]: = m + c (y, x) Eğer m = q [y-1, x-1] p [y, x]: = -1 Aksi takdirde m = q [y-1, x] p [y, x]: = 0 Başka                 p [y, x]: = 1

Şimdi geri kalanı minimum olanı bulup yazdırmakla ilgili basit bir mesele.

 işlevi computeShortestPath () computeShortestPathArrays () minIndex: = 1 dak: = q [n, 1] için ben itibaren 2 -e n Eğer q [n, i] 
 işlevi printPath (y, x) Yazdır(x) Yazdır("<-")     Eğer y = 2 Yazdır(x + p [y, x]) Başka         printPath (y-1, x + p [y, x])

Sıra hizalaması

İçinde genetik, sıra hizalaması dinamik programlamanın gerekli olduğu önemli bir uygulamadır.[11] Tipik olarak sorun, bir öğeyi değiştiren, ekleyen veya kaldıran düzenleme işlemleri kullanılarak bir diziyi diğerine dönüştürmekten oluşur. Her operasyonun ilişkili bir maliyeti vardır ve amaç, en düşük toplam maliyeti olan düzenleme dizisi.

Sorun doğal olarak bir özyineleme olarak ifade edilebilir, bir A dizisi en iyi şekilde bir B dizisine dönüştürülür:

  1. B'nin ilk karakterini eklemek ve A'nın ve B'nin kuyruğunun optimum hizalamasını yapmak
  2. A'nın ilk karakterini silmek ve A ve B'nin kuyruğunun optimum hizalamasını gerçekleştirmek
  3. A'nın ilk karakterini B'nin ilk karakteriyle değiştirmek ve A ve B'nin kuyruklarının en iyi şekilde hizalanmasını sağlamak.

Kısmi hizalamalar, hücre (i, j) 'nin A [1..i]' nin B [1..j] 'ye optimum hizalanmasının maliyetini içerdiği bir matriste tablo haline getirilebilir. (İ, j) hücresindeki maliyet, ilgili işlemlerin maliyetini komşu hücrelerin maliyetine ekleyerek ve optimum olanı seçerek hesaplanabilir.

Farklı varyantlar mevcuttur, bakınız Smith – Waterman algoritması ve Needleman-Wunsch algoritması.

Hanoi Kulesi yapboz

Hanoi Kulelerinin bir model seti (8 diskli)
Animasyonlu bir çözüm Hanoi kulesi için yapboz T (4,3).

Hanoi kulesi veya Kuleleri Hanoi bir matematik oyunu veya bulmaca. Üç çubuktan ve herhangi bir çubuğun üzerine kayabilen farklı boyutlarda birkaç diskten oluşur. Bulmaca, en üstte en küçüğü olan bir çubuk üzerinde artan boyut sırasına göre düzgün bir yığın halinde olan disklerle başlar, böylece konik bir şekil oluşturur.

Bulmacanın amacı, aşağıdaki kurallara uyarak tüm yığını başka bir çubuğa taşımaktır:

  • Bir seferde yalnızca bir disk taşınabilir.
  • Her hareket, üst diski çubuklardan birinden alıp başka bir çubuğun üzerine, o çubukta zaten mevcut olabilecek diğer disklerin üzerine kaydırmayı içerir.
  • Daha küçük bir diskin üzerine disk yerleştirilemez.

Dinamik programlama çözümü, fonksiyonel denklem

S (n, h, t) = S (n-1, h, değil (h, t)); S (1, h, t); S (n-1, değil (h, t), t)

burada n, hareket ettirilecek disk sayısını belirtir, h ana çubuğu belirtir, t hedef çubuğu gösterir, (h, t) üçüncü çubuğu (ne h ne de t) belirtmez, ";" bitiştirmeyi belirtir ve

S (n, h, t): = h çubuğundan t çubuğuna hareket ettirilecek n diskten oluşan bir soruna çözüm.

N = 1 için sorun önemsizdir, yani S (1, h, t) = "bir diski h çubuğundan t çubuğuna hareket ettir" (yalnızca bir disk kaldı).

Bu çözümün gerektirdiği hareket sayısı 2'dirn - 1. Amaç, maksimize etmek hareket sayısı (döngü yapmadan) sonra dinamik programlama fonksiyonel denklem biraz daha karmaşık ve 3n - 1 hareket gereklidir.[12]

Yumurta bırakma bulmaca

Aşağıdaki, bu ünlü olay örneğinin bir açıklamasıdır. bulmaca N = 2 yumurta ve H = 36 katlı bir bina içeren:[13]

36 katlı bir binada hangi katların yumurtaları bırakmanın güvenli olduğunu ve hangilerinin inişte yumurtaların kırılmasına neden olacağını bilmek istediğimizi varsayalım ( Amerikan ingilizcesi birinci katın zemin seviyesinde olduğu terminoloji). Birkaç varsayım yapıyoruz:
  • Düşmeden kurtulan bir yumurta tekrar kullanılabilir.
  • Kırık bir yumurta atılmalıdır.
  • Düşmenin etkisi tüm yumurtalar için aynıdır.
  • Yumurta düştüğünde kırılırsa, daha yüksek bir pencereden düşürülürse kırılır.
  • Bir yumurta düşerek hayatta kalırsa, daha kısa bir düşüşten sonra hayatta kalır.
  • Birinci kattaki pencerelerin yumurtaları kırdığı ve yumurtaların 36. kattaki pencerelere dayanabileceği de göz ardı edilmedi.
Sadece bir yumurta varsa ve doğru sonucu aldığımızdan emin olmak istiyorsak, deney tek bir şekilde yapılabilir. Yumurtayı birinci kat penceresinden bırakın; hayatta kalırsa, ikinci katın penceresinden bırakın. Kırılana kadar yukarı doğru devam edin. En kötü durumda, bu yöntem 36 dışkı gerektirebilir. 2 yumurtanın mevcut olduğunu varsayalım. Her durumda işe yaraması garanti edilen en düşük yumurta dışkısı sayısı nedir?

Dinamik bir programlama türetmek için fonksiyonel denklem bu bulmaca için durum Dinamik programlama modelinin bir çifti s = (n, k) olsun, burada

n = mevcut test yumurtası sayısı, n = 0, 1, 2, 3, ..., N − 1.
k = Henüz test edilecek (ardışık) kat sayısı, k = 0, 1, 2, ..., H − 1.

Örneğin, s = (2,6), iki test yumurtasının mevcut olduğunu ve 6 (ardışık) katın henüz test edilmediğini gösterir. Sürecin ilk hali s = (N,H) nerede N deneyin başlangıcında mevcut olan test yumurtalarının sayısını gösterir. İşlem, test yumurtası kalmadığında sona erer (n = 0) veya ne zaman k = 0, hangisi önce gelirse. Durumda fesih olursa s = (0,k) ve k > 0, sonra test başarısız oldu.

Şimdi izin ver

W(n,k) = İşlemin durumda olduğu göz önüne alındığında, en kötü durum senaryosunda kritik katın değerini belirlemek için gereken minimum deneme sayısı s = (n,k).

O zaman gösterilebilir ki[14]

W(n,k) = 1 + min {maks (W(n − 1, x − 1), W(n,kx)): x = 1, 2, ..., k }

ile W(n, 0) = 0 hepsi için n > 0 ve W(1,k) = k hepsi içink. Sistematik olarak değerleri artırarak bu denklemi yinelemeli olarak çözmek kolaydır. n vek.

Farklı bir parametrelendirme kullanarak daha hızlı DP çözümü

Yukarıdaki çözümün gerektirdiğine dikkat edin DP çözümü ile zaman. Bu iyileştirilebilir optimumda ikili aramayla zaman yukarıdaki yinelemede, çünkü artıyor süre azalıyor bu nedenle yerel minimum küresel bir minimumdur. Ayrıca, optimum DP tablosundaki her hücre için ve önceki hücre için değerine atıfta bulunarak, optimal her hücre için sabit zamanda bulunabilir ve zaman. Bununla birlikte, problemin farklı bir parametrizasyonunu içeren daha da hızlı bir çözüm var:

İzin Vermek toplam kat sayısı olacak şekilde, yumurtadan düştüğünde kırılacak kat (Yukarıdaki örnek almakla eşdeğerdir) ).

İzin Vermek kırılması için yumurtanın düşürülmesi gereken minimum zemin olmalıdır.

İzin Vermek maksimum değer sayısı olmak kullanılarak ayırt edilebilir dener ve yumurtalar.

Sonra hepsi için .

İzin Vermek Optimal stratejide ilk yumurtanın düştüğü zemin olun.

İlk yumurta kırılırsa, kimden -e ve en çok kullanılarak ayırt edilebilir dener ve yumurtalar.

İlk yumurta kırılmadıysa, kimden -e ve kullanılarak ayırt edilebilir dener ve yumurtalar.

Bu nedenle, .

O zaman sorun minimum olanı bulmakla eşdeğerdir öyle ki .

Bunu yapmak için hesaplayabiliriz artan sırayla , hangisi alacak zaman.

Dolayısıyla, durumu ayrı ayrı ele alırsak algoritma alacaktı zaman.

Ancak yineleme ilişkisi aslında çözülebilir, hesaplanabilir kimliği kullanma zamanı hepsi için .

Dan beri hepsi için ikili arama yapabiliriz bulmak , vermek algoritması.[15]

Matris zinciri çarpımı

Matris zinciri çarpımı, dinamik programlamanın faydasını gösteren iyi bilinen bir örnektir. Örneğin, mühendislik uygulamaları genellikle bir matris zincirini çarpmak zorundadır. 100 × 100 gibi büyük boyutlu matrisler bulmak şaşırtıcı değildir. Bu nedenle, görevimiz matrisleri çarpmaktır . Temel doğrusal cebirden bildiğimiz gibi, matris çarpımı değişmeli değil, ilişkiseldir; ve aynı anda sadece iki matrisi çarpabiliriz. Dolayısıyla, bu matris zincirini birçok farklı şekilde çarpabiliriz, örneğin:

((A1 × A2) × A3) × ... An
Bir1× (((A2× A3) × ...) × An)
(Bir1 × A2) × (A3 × ... birn)

ve benzeri. Bu matris zincirini çarpmanın birçok yolu vardır. Hepsi aynı nihai sonucu üretecek, ancak hangi matrislerin çarpıldığına bağlı olarak hesaplaması daha fazla veya daha az zaman alacak. Matris A'nın boyutları m × n ve matris B'nin boyutları n × q varsa, o zaman C = A × B matrisi m × q boyutlarına sahip olacak ve m * n * q skaler çarpımları gerektirecektir (amaçlar için basit bir matris çarpım algoritması kullanarak illüstrasyon).

Örneğin, A, B ve C matrislerini çarpalım. Boyutlarının sırasıyla m × n, n × p ve p × s olduğunu varsayalım. A × B × C matrisi m × s boyutunda olacaktır ve aşağıda gösterilen iki şekilde hesaplanabilir:

  1. Ax(B×C) This order of matrix multiplication will require nps + mns scalar multiplications.
  2. (A×B)×C This order of matrix multiplication will require mnp + mps scalar calculations.

Let us assume that m = 10, n = 100, p = 10 and s = 1000. So, the first way to multiply the chain will require 1,000,000 + 1,000,000 calculations. The second way will require only 10,000+100,000 calculations. Obviously, the second way is faster, and we should multiply the matrices using that arrangement of parenthesis.

Therefore, our conclusion is that the order of parenthesis matters, and that our task is to find the optimal order of parenthesis.

At this point, we have several choices, one of which is to design a dynamic programming algorithm that will split the problem into overlapping problems and calculate the optimal arrangement of parenthesis. The dynamic programming solution is presented below.

Let's call m[i,j] the minimum number of scalar multiplications needed to multiply a chain of matrices from matrix i to matrix j (i.e. Aben × .... × Aj, i.e. i<=j). We split the chain at some matrix k, such that i <= k < j, and try to find out which combination produces minimum m[i,j].

Formül şudur:

       Eğer i = j, m[i,j]= 0       Eğer i < j, m[i,j]= min over all possible values of k (m[i,k]+m[k+1,j] + )

nerede k aralıkları ben -e j − 1.

  • is the row dimension of matrix i,
  • is the column dimension of matrix k,
  • is the column dimension of matrix j.

This formula can be coded as shown below, where input parameter "chain" is the chain of matrices, i.e. :

 işlevi OptimalMatrixChainParenthesis(chain)     n = length(chain)     için i = 1, n         m[i,i] = 0    // Since it takes no calculations to multiply one matrix     için len = 2, n         için i = 1, n - len + 1             j = i + len -1             m[i,j] = infinity      // So that the first calculation updates             için k = i, j-1                 q = m[i, k] + m[k+1, j] +                  Eğer q < m[i, j]     // The new order of parentheses is better than what we had                     m[i, j] = q    // Update                     s[i, j] = k    // Record which k to split on, i.e. where to place the parenthesis

So far, we have calculated values for all possible m[ben, j], the minimum number of calculations to multiply a chain from matrix ben to matrix j, and we have recorded the corresponding "split point"s[ben, j]. For example, if we are multiplying chain Bir1×A2×A3×A4, and it turns out that m[1, 3] = 100 ve s[1, 3] = 2, that means that the optimal placement of parenthesis for matrices 1 to 3 is and to multiply those matrices will require 100 scalar calculation.

This algorithm will produce "tables" m[, ] and s[, ] that will have entries for all possible values of i and j. The final solution for the entire chain is m[1, n], with corresponding split at s[1, n]. Unraveling the solution will be recursive, starting from the top and continuing until we reach the base case, i.e. multiplication of single matrices.

Therefore, the next step is to actually split the chain, i.e. to place the parenthesis where they (optimally) belong. For this purpose we could use the following algorithm:

işlevi PrintOptimalParenthesis(s, i, j)    Eğer i = j        print "A"i    else        print "("         PrintOptimalParenthesis(s, i, s[i, j])         PrintOptimalParenthesis(s, s[i, j] + 1, j)         print ")"

Of course, this algorithm is not useful for actual multiplication. This algorithm is just a user-friendly way to see what the result looks like.

To actually multiply the matrices using the proper splits, we need the following algorithm:

   işlevi MatrixChainMultiply(Zincir itibaren 1 -e n)       // returns the final matrix, i.e. A1×A2×... ×An      OptimalMatrixChainParenthesis(Zincir itibaren 1 -e n)   // this will produce s[ . ] and m[ . ] "tables"      OptimalMatrixMultiplication(s, Zincir itibaren 1 -e n)  // actually multiply   işlevi OptimalMatrixMultiplication(s, ben, j)   // returns the result of multiplying a chain of matrices from Ai to Aj in optimal way      Eğer ben < j         // keep on splitting the chain and multiplying the matrices in left and right sides         LeftSide = OptimalMatrixMultiplication(s, ben, s[ben, j])         RightSide = OptimalMatrixMultiplication(s, s[ben, j] + 1, j)         dönüş MatrixMultiply(LeftSide, RightSide)       else Eğer ben = j         dönüş Ai   // matrix at position i      else          Yazdır "error, i <= j must hold"    işlevi MatrixMultiply(Bir, B)    // function that multiplies two matrices      Eğer sütunlar(Bir) = satırlar(B)          için ben = 1, satırlar(Bir)            için j = 1, sütunlar(B)               C[ben, j] = 0               için k = 1, sütunlar(Bir)                   C[ben, j] = C[ben, j] + Bir[ben, k]*B[k, j]                dönüş C       else           Yazdır "error, incompatible dimensions."

Tarih

Dönem dinamik program was originally used in the 1940s by Richard Bellman to describe the process of solving problems where one needs to find the best decisions one after another. By 1953, he refined this to the modern meaning, referring specifically to nesting smaller decision problems inside larger decisions,[16] and the field was thereafter recognized by the IEEE olarak sistem Analizi ve mühendislik konu. Bellman's contribution is remembered in the name of the Bellman denklemi, a central result of dynamic programming which restates an optimization problem in yinelemeli form.

Bellman explains the reasoning behind the term dinamik program otobiyografisinde Eye of the Hurricane: An Autobiography:

I spent the Fall quarter (of 1950) at RAND. My first task was to find a name for multistage decision processes. An interesting question is, "Where did the name, dynamic programming, come from?" The 1950s were not good years for mathematical research. We had a very interesting gentleman in Washington named Wilson. He was Secretary of Defense, and he actually had a pathological fear and hatred of the word research. I’m not using the term lightly; I’m using it precisely. His face would suffuse, he would turn red, and he would get violent if people used the term research in his presence. You can imagine how he felt, then, about the term mathematical. The RAND Corporation was employed by the Air Force, and the Air Force had Wilson as its boss, essentially. Hence, I felt I had to do something to shield Wilson and the Air Force from the fact that I was really doing mathematics inside the RAND Corporation. What title, what name, could I choose? In the first place I was interested in planning, in decision making, in thinking. But planning, is not a good word for various reasons. I decided therefore to use the word "programming". I wanted to get across the idea that this was dynamic, this was multistage, this was time-varying. I thought, let's kill two birds with one stone. Let's take a word that has an absolutely precise meaning, namely dynamic, in the classical physical sense. It also has a very interesting property as an adjective, and that is it's impossible to use the word dynamic in a pejorative sense. Try thinking of some combination that will possibly give it a pejorative meaning. Bu imkansız. Thus, I thought dynamic programming was a good name. It was something not even a Congressman could object to. So I used it as an umbrella for my activities.

— Richard Bellman, Eye of the Hurricane: An Autobiography (1984, page 159)

Kelime dinamik was chosen by Bellman to capture the time-varying aspect of the problems, and because it sounded impressive.[11] Kelime programlama referred to the use of the method to find an optimal program, in the sense of a military schedule for training or logistics. This usage is the same as that in the phrases doğrusal programlama ve matematiksel programlamaeşanlamlısı matematiksel optimizasyon.[17]

The above explanation of the origin of the term is lacking. As Russell and Norvig in their book have written, referring to the above story: "This cannot be strictly true, because his first paper using the term (Bellman, 1952) appeared before Wilson became Secretary of Defense in 1953."[18] Also, there is a comment in a speech by Harold J. Kushner, where he remembers Bellman. Quoting Kushner as he speaks of Bellman: "On the other hand, when I asked him the same question, he replied that he was trying to upstage Dantzig's linear programming by adding dynamic. Perhaps both motivations were true."

Algorithms that use dynamic programming

Ayrıca bakınız

Referanslar

  1. ^ a b Cormen, T. H.; Leiserson, C. E.; Rivest, R. L .; Stein, C. (2001), Introduction to Algorithms (2nd ed.), MIT Press & McGraw–Hill, ISBN  0-262-03293-7 . pp. 344.
  2. ^ Kamien, M. I.; Schwartz, N. L. (1991). Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management (İkinci baskı). New York: Elsevier. s. 261. ISBN  978-0-444-01609-6.
  3. ^ Kirk, Donald E. (1970). Optimal Control Theory: An Introduction. Englewood Kayalıkları, NJ: Prentice-Hall. s. 94–95. ISBN  978-0-13-638098-6.
  4. ^ "M. Memo". J Kelime Bilgisi. J Yazılım. Alındı 28 Ekim 2011.
  5. ^ DeLisi, Biopolymers, 1974, Volume 13, Issue 7, pages 1511–1512, July 1974
  6. ^ Gurskiĭ GV, Zasedatelev AS, Biofizika, 1978 Sep-Oct;23(5):932-46
  7. ^ Sniedovich, M. (2006), "Dijkstra's algorithm revisited: the dynamic programming connexion" (PDF), Journal of Control and Cybernetics, 35 (3): 599–620. Online version of the paper with interactive computational modules.
  8. ^ Denardo, E.V. (2003), Dynamic Programming: Models and Applications, Mineola, NY: Dover Yayınları, ISBN  978-0-486-42810-9
  9. ^ Sniedovich, M. (2010), Dynamic Programming: Foundations and Principles, Taylor ve Francis, ISBN  978-0-8247-4099-3
  10. ^ Dijkstra 1959, s. 270
  11. ^ a b c Eddy, S.R. (2004). "What is Dynamic Programming?". Doğa Biyoteknolojisi. 22 (7): 909–910. doi:10.1038/nbt0704-909. PMID  15229554. S2CID  5352062.
  12. ^ Moshe Sniedovich (2002), "OR/MS Games: 2. The Towers of Hanoi Problem", BİLGİLER Eğitim İşlemleri, 3 (1): 34–51, doi:10.1287/ited.3.1.45.
  13. ^ Konhauser J.D.E., Velleman, D., and Wagon, S. (1996). Which way did the Bicycle Go? Dolciani Mathematical Expositions – No 18. Amerika Matematik Derneği.
  14. ^ Sniedovich, Moshe (2003). "OR/MS Games: 4. The Joy of Egg-Dropping in Braunschweig and Hong Kong". Informs Transactions on Education. 4: 48–64. doi:10.1287/ited.4.1.48.
  15. ^ Dean Connable Wills, Connections between combinatorics of permutations and algorithms and geometry
  16. ^ Stuart Dreyfus. "Richard Bellman on the birth of Dynamical Programming".
  17. ^ Nocedal, J.; Wright, S. J. (2006). Sayısal Optimizasyon. Springer. s.9.
  18. ^ Russell, S .; Norvig, P. (2009). Yapay Zeka: Modern Bir Yaklaşım (3. baskı). Prentice Hall. ISBN  978-0-13-207148-2.

daha fazla okuma

Dış bağlantılar