Yinelemeli Şablon Döngüleri - Iterative Stencil Loops

7 noktalı 3B'nin şekli von Neumann stil şablonu.

Yinelemeli Şablon Döngüleri (ISL'ler) bir sayısal veri işleme çözümü sınıfıdır[1]hangi güncelleme dizi elemanları bazı sabit kalıplara göre, şablon olarak adlandırılır.[2] En yaygın olarak şurada bulunurlar: bilgisayar simülasyonları, Örneğin. için hesaplamalı akışkanlar dinamiği bilimsel ve mühendislik uygulamaları bağlamında. Diğer dikkate değer örnekler arasında çözme kısmi diferansiyel denklemler,[1] Jacobi çekirdek, the Gauss – Seidel yöntemi,[2] görüntü işleme[1] ve hücresel otomata.[3] Dizilerin normal yapısı, şablon tekniklerini diğer modelleme yöntemlerinden ayrı olarak ayarlar. Sonlu eleman yöntemi. Çoğu sonlu fark kodları Düzenli şebekelerde çalışan ISL'ler olarak formüle edilebilir.

Tanım

ISL'ler, belirli bir dizi boyunca bir dizi süpürme (zaman adımları adı verilir) gerçekleştirir.[2] Genellikle bu 2 veya 3 boyutlu düzenli bir ızgaradır.[3] Dizilerin öğeleri genellikle hücreler olarak adlandırılır. Her zaman adımında tüm dizi öğeleri güncellenir.[2] Komşu dizi öğelerini sabit bir modelde (şablon) kullanarak, her hücrenin yeni değeri hesaplanır. Çoğu durumda sınır değerleri değişmeden bırakılır, ancak bazı durumlarda (ör. LBM kodları ) bunların da hesaplama sırasında ayarlanması gerekir. Şablon her öğe için aynı olduğundan, veri erişimlerinin örüntüsü tekrarlanır.[4]

Daha resmi olarak, ISL'leri bir 5 tuple aşağıdaki anlamla:[3]

  • dizin kümesidir. Dizinin topolojisini tanımlar.
  • (zorunlu olarak sonlu olması gerekmez), her bir hücrenin herhangi bir belirli zaman adımında üstlenebileceği durumlar kümesidir.
  • 0 zamanında sistemin başlangıç ​​durumunu tanımlar.
  • şablonun kendisidir ve mahallenin gerçek şeklini tanımlar. Var şablondaki öğeler.
  • bir hücrenin komşularına bağlı olarak yeni durumunu belirlemek için kullanılan geçiş işlevidir.

Dan beri ben bir kboyutlu tamsayı aralığı, dizi her zaman sonlu bir düzenli ızgaranın topolojisine sahip olacaktır. Dizi aynı zamanda simülasyon alanı olarak da adlandırılır ve tek tek hücreler indeksleriyle tanımlanır . Şablon sıralı bir settir göreceli koordinatlar. Artık her hücre için elde edebiliriz komşularının indeksleri

Durumları, tuple haritalanarak verilir karşılık gelen durum kümesine , nerede aşağıdaki gibi tanımlanır:

Aşağıdaki zaman adımları için sistemin durumunu tanımlamak için ihtiyacımız olan tek şey bu ile :

Bunu not et üzerinde tanımlanmıştır ve sadece açık değil çünkü sınır koşullarının da ayarlanması gerekiyor. Bazen unsurları toroidal topolojileri gerçekleştirmek için simülasyon uzayının boyutuna bir vektör toplama modülü ile tanımlanabilir:

Bu uygulama için yararlı olabilir periyodik sınır koşulları, belirli fiziksel modelleri basitleştiriyor.

Örnek: 2B Jacobi yinelemesi

2B dizideki seçili hücrenin veri bağımlılıkları.

Biçimsel tanımı göstermek için, iki boyutlu bir Jacobi yineleme tanımlanabilir. Güncelleme işlevi, bir hücrenin dört komşusunun aritmetik ortalamasını hesaplar. Bu durumda, ilk çözüm olan 0 ile yola çıkıyoruz. Sol ve sağ sınırlar 1'de sabitlenirken, üst ve alt sınırlar 0'a ayarlanıyor. Yeterli sayıda yinelemeden sonra, sistem bir eyer şekline yakınsıyor.

S_0
S_200
S_400
S_600
S_800
S_1000
2B Jacobi Yinelemesi Dizi

Şablonlar

Güncellemeler sırasında kullanılan mahallenin şekli uygulamanın kendisine bağlıdır. En yaygın şablonlar, sayfanın 2D veya 3D versiyonlarıdır. von Neumann mahallesi ve Moore mahallesi. Yukarıdaki örnekte bir 2D von Neumann şablonu kullanılırken, LBM kodları genellikle 3D varyantını kullanır. Conway'in Hayat Oyunu 2D Moore mahallesini kullanır. Bununla birlikte, sismik dalga yayılımı için 25 noktalı şablon gibi diğer şablonlar[5] da bulunabilir.

9 noktalı şablon
9 noktalı 2D şablon
5 noktalı şablon
5 noktalı 2D şablon
6 noktalı şablon
7 noktalı 3B şablon
25 noktalı şablon
25 noktalı 3B şablon
Çeşitli bilimsel uygulamalarda kullanılan şablonlardan bir seçki.

Uygulama sorunları

Birçok simülasyon kodu doğal olarak ISL'ler olarak formüle edilebilir. Hesaplama süresi ve bellek tüketimi, dizi öğelerinin sayısı ile doğrusal olarak arttığından, ISL'lerin paralel uygulamaları araştırma için büyük önem taşımaktadır.[6] Hesaplamalar sıkı bir şekilde bağlandığından (komşu hücrelere bağlı hücre güncellemeleri nedeniyle) ve çoğu ISL belleğe bağlı olduğundan (yani bellek erişimlerinin hesaplamalara oranı yüksektir).[7] ISL'leri verimli bir şekilde yürütmek için neredeyse tüm mevcut paralel mimariler araştırılmıştır;[8] Şu an GPGPU'lar en verimli olduğunu kanıtladı.[9]

Kitaplıklar

ISL'lerin önemi nedeniyle bilgisayar simülasyonları ve yüksek hesaplama gereksinimleri, bilim adamlarını şablon tabanlı hesaplamalar gerçekleştirmede desteklemek için yeniden kullanılabilir kitaplıklar oluşturmayı amaçlayan bir dizi çaba vardır. Kütüphaneler çoğunlukla paralelleştirme ile ilgilenirler, ancak aynı zamanda IO, direksiyon ve kontrol noktası belirleme. API'lerine göre sınıflandırılabilirler.

Yama tabanlı kitaplıklar

Bu geleneksel bir tasarımdır. Kütüphane bir dizi nkullanıcı programının güncellemeleri gerçekleştirmek için erişebileceği boyutlu skaler diziler. Kütüphane, sınırların senkronizasyonunu yönetir (hayalet bölge veya hale olarak adlandırılır). Bu arayüzün avantajı, kullanıcı programının diziler üzerinde döngü oluşturabilmesidir, bu da eski kodu entegre etmeyi kolaylaştırır. [10]. Dezavantajı, kütüphanenin önbellek engellemesini işleyememesidir (çünkü bu, döngüler içinde yapılmalıdır.[11]) veya hızlandırıcılar için API çağrılarının sarılması (örneğin CUDA veya OpenCL aracılığıyla). Uygulamalar şunları içerir: Kaktüs, bir fizik problem çözme ortamı ve waLBerla.

Hücre tabanlı kitaplıklar

Bu kütüphaneler arayüzü tek simülasyon hücrelerini güncellemeye taşır: sadece mevcut hücre ve komşuları, örn. alıcı / ayarlayıcı yöntemleri aracılığıyla. Bu yaklaşımın avantajı, kütüphanenin hangi hücrelerin hangi sırayla güncellendiğini sıkı bir şekilde kontrol edebilmesidir; bu, yalnızca önbellek engellemeyi uygulamak için yararlı değildir.[9] aynı kodu çoklu çekirdeklerde ve GPU'larda çalıştırmak için.[12] Bu yaklaşım, kullanıcının kaynak kodunu kitaplıkla birlikte yeniden derlemesini gerektirir. Aksi takdirde, her hücre güncellemesi için performansı ciddi şekilde bozacak bir işlev çağrısı gerekecektir. Bu sadece aşağıdaki gibi tekniklerle mümkündür sınıf şablonları veya metaprogramlama Bu tasarımın yalnızca yeni kütüphanelerde bulunmasının nedeni de budur. Örnekler Fizik ve LibGeoDecomp.

Ayrıca bakınız

Referanslar

  1. ^ a b c Roth, Gerald vd. (1997) SC'97 Bildirileri: Yüksek Performanslı Ağ Oluşturma ve Hesaplama. Şablonları Yüksek Performanslı Fortran'da Derleme.
  2. ^ a b c d Sloot, Peter M.A. vd. (28 Mayıs 2002) Hesaplamalı Bilim - ICCS 2002: Uluslararası Konferans, Amsterdam, Hollanda, 21–24 Nisan 2002. Bildiriler, Bölüm I. Sayfa 843. Yayıncı: Springer. ISBN  3-540-43591-3.
  3. ^ a b c Fey, Dietmar vd. (2010) Grid-Computing: Eine Basistechnologie für Computational Science. Sayfa 439. Yayıncı: Springer. ISBN  3-540-79746-7
  4. ^ Yang, Laurence T .; Guo, Minyi. (12 Ağustos 2005) Yüksek Performanslı Hesaplama: Paradigma ve Altyapı. Sayfa 221. Yayıncı: Wiley-Interscience. ISBN  0-471-65471-X
  5. ^ Micikevicius, Paulius ve diğerleri. (2009) CUDA kullanarak GPU'larda 3B sonlu fark hesaplaması Grafik İşleme Birimlerinde Genel Amaçlı İşleme 2. Çalıştayı Bildirileri ISBN  978-1-60558-517-8
  6. ^ Datta, Kaushik (2009) Önbellek Tabanlı Çok Çekirdekli Platformlar için Otomatik Ayarlama Şablon Kodları Arşivlendi 2012-10-08 de Wayback Makinesi, Ph.D. Tez
  7. ^ Wellein, G vd. (2009) Çok çekirdekli dalga cephesi paralelleştirmesi ile şablon hesaplamaları için verimli zamansal engelleme, 33. Yıllık IEEE Uluslararası Bilgisayar Yazılımları ve Uygulamaları Konferansı, COMPSAC 2009
  8. ^ Datta, Kaushik vd. (2008) Son teknoloji ürünü çok çekirdekli mimarilerde şablon hesaplama optimizasyonu ve otomatik ayarlama, Süper hesaplama üzerine 2008 ACM / IEEE konferansının SC '08 Bildirileri
  9. ^ a b Schäfer, Andreas ve Fey, Dietmar (2011) GPGPU'lar için Yüksek Performanslı Şablon Kodu Algoritmaları, Uluslararası Hesaplamalı Bilim Konferansı Bildirileri, ICCS 2011
  10. ^ S. Donath, J. Götz, C. Feichtinger, K. Iglberger ve U. Rüde (2010) waLBerla: Binlerce İşlemcili Itanium Tabanlı Sistemler için Optimizasyon, Bilim ve Mühendislikte Yüksek Performanslı Hesaplama, Garching / Münih 2009
  11. ^ Nguyen, Anthony vd. (2010) Modern CPU'larda ve GPU'larda Şablon Hesaplamaları için 3,5-D Engelleme Optimizasyonu, Yüksek Performanslı Hesaplama, Ağ Oluşturma, Depolama ve Analiz için 2010 ACM / IEEE Uluslararası Konferansı'nın SC '10 Bildirileri
  12. ^ Naoya Maruyama, Tatsuo Nomura, Kento Sato ve Satoshi Matsuoka (2011) Physis: Büyük Ölçekli GPU Hızlandırmalı Süper Bilgisayarlarda Şablon Hesaplamaları için Örtük Paralel Programlama Modeli, SC '11 2011 ACM / IEEE Uluslararası Yüksek Performanslı Hesaplama, Ağ Oluşturma, Depolama ve Analiz Konferansı Bildirileri

Dış bağlantılar