Eşzamanlı hash tablosu - Concurrent hash table

Aynı hash tablosuna eşzamanlı erişim.

Bir eşzamanlı karma tablo (eşzamanlı hash haritası), hash tablolarının bir uygulamasıdır. eşzamanlı erişim tarafından çoklu İş Parçacığı kullanarak Özet fonksiyonu.[1][2]

Eşzamanlı hash tabloları bu nedenle bir anahtarı temsil eder eşzamanlı veri yapısı kullanmak için eşzamanlı hesaplama paylaşılan veriler arasında bir hesaplama için birden fazla iş parçacığının daha verimli bir şekilde işbirliği yapmasına izin verir.[1]

Eşzamanlı erişimle ilgili doğal sorunlar nedeniyle - yani çekişme - Tabloya eşzamanlı olarak erişilebildiği yol ve kapsam, uygulamaya bağlı olarak değişir. Ayrıca, ortaya çıkan hızlanma, çekişmenin çözülmesi gerektiği için kullanılan iş parçacığı miktarı ile doğrusal olmayabilir, tepeden.[1] Anlaşmazlığın etkilerini azaltmak için, her biri doğruluk masadaki işlemlerin.[1][2][3][4]

Sıralı emsallerinde olduğu gibi, eşzamanlı karma tablolar genelleştirilebilir ve anahtarlar ve değerler için daha karmaşık veri türlerinin kullanılmasına izin vermek gibi daha geniş uygulamalara uyacak şekilde genişletilebilir. Ancak bu genellemeler performansı olumsuz etkileyebilir ve bu nedenle uygulamanın gerekliliklerine göre seçilmelidir.[1]

Eşzamanlı hashing

Eşzamanlı karma tablolar oluştururken, seçilen karma algoritma ile tabloya erişen işlevlerin bir çakışma çözme stratejisi ekleyerek eşzamanlılık için uyarlanması gerekir. Böyle bir strateji, erişimlerin, paralel olarak kullanıldığında ideal olarak verimliliklerini artırırken, bunlardan kaynaklanan çatışmaların bozuk verilere neden olmayacak şekilde yönetilmesini gerektirir. Herlihy ve Shavit[5] Böyle bir strateji olmadan bir karma tabloya erişimin nasıl olduğunu açıklayın - örneğinde, Guguklu haşlama algoritma - eşzamanlı kullanım için uyarlanabilir. Fan vd.[6]ayrıca, guguk kuşu hashini temel alan bir tablo erişim şemasını tarif eder, bu sadece eşzamanlı olmakla kalmaz, aynı zamanda hashing işlevinin alan verimliliğini korurken, aynı zamanda önbellek konumunu ve eklemelerin verimini iyileştirir.

Karma tablolar boyut olarak sınırlandırılmadıklarında ve bu nedenle gerektiğinde büyümelerine / küçülmelerine izin verildiğinde, karma algoritmanın bu işleme izin verecek şekilde uyarlanması gerekir. Bu, yeniden boyutlandırılan tablonun yeni anahtar alanını yansıtmak için kullanılan karma işlevin değiştirilmesini gerektirir. Bir eşzamanlı büyüme algoritması, Maier ve ark.[1]

Mega-KV[7] yüksek performanslı bir anahtar-değer saklama sistemidir. guguklu haşlama kullanılır ve KV indeksleme, GPU tarafından toplu modda büyük ölçüde paralelleştirilir. GPU hızlandırmanın daha fazla optimizasyonu ile NVIDIA ve Oak Ridge Ulusal Laboratuvarı Mega-KV, 2018'de iş hacminde başka bir yüksek rekora (saniyede 888 milyona kadar anahtar-değer işlemi) itildi.[8]

Uyuşmazlık yönetimi

Çekişmeye neden olan eşzamanlı erişim (kırmızıyla işaretlenmiştir).

Herhangi bir eşzamanlı veri yapısında olduğu gibi, eşzamanlı hash tabloları, çekişmenin bir sonucu olarak eşzamanlı hesaplama alanında bilinen çeşitli sorunlardan muzdariptir.[3] Örnekler şunlardır: ABA sorunu, yarış koşulları, ve kilitlenmeler Bu sorunların ortaya çıkma ve hatta ortaya çıkma derecesi, eşzamanlı karma tablosunun uygulanmasına bağlıdır; özellikle tablonun eşzamanlı olarak çalıştırılmasına izin verdiği operasyonların yanı sıra çekişmeyle ilişkili sorunları hafifletme stratejileri. Çekişmeyi ele alırken, ana amaç diğer eşzamanlı veri yapıları ile aynıdır, yani tablodaki her işlem için doğruluğun sağlanması. Aynı zamanda, aynı anda kullanıldığında sıralı bir çözümden daha verimli olacak şekilde doğal olarak yapılmalıdır. Bu aynı zamanda eşzamanlılık kontrolü.

Atomik talimatlar

Kullanma atomik Talimatlar gibi karşılaştır ve değiştir veya getir ve ekle, çekişmeden kaynaklanan sorunlar, başka bir erişimin müdahale etme şansı olmadan önce bir erişimin tamamlanması sağlanarak azaltılabilir. Karşılaştırma ve değiştirme gibi işlemler, çoğu zaman hangi veri boyutlarını işleyebilecekleri konusunda sınırlamalar getirir; bu, bir tablonun anahtar ve değer türlerinin buna göre seçilmesi veya dönüştürülmesi gerektiği anlamına gelir.[1]

Sözde Donanımı Kullanma İşlem Belleği (HTM), tablo işlemleri çok benzer şekilde düşünülebilir veritabanı işlemleri,[3] atomikliği sağlamak. Uygulamada HTM'ye bir örnek, İşlem Senkronizasyon Uzantıları.

Kilitleme

Yardımıyla kilitler, tabloya veya içindeki değerlere eşzamanlı olarak erişmeye çalışan işlemler, doğru davranışı sağlayacak şekilde gerçekleştirilebilir. Ancak bu, olumsuz performans etkilerine yol açabilir,[1][6] özellikle kullanılan kilitler çok kısıtlayıcı olduğunda, bu nedenle aksi takdirde rekabet etmeyecek ve herhangi bir soruna neden olmadan yürütülebilecek erişimlerin engellenmesi. Canlı kilitler, kilitlenmeler veya kilitlenmelerde olduğu gibi, doğruluğu tehdit eden daha kritik sorunlardan kaçınmak için daha fazla değerlendirme yapılmalıdır. açlık.[3]

Faz eşzamanlılığı

Eşzamanlı erişim, farklı aşamalar halinde gruplandırılmıştır.

Bir faz eşzamanlı karma tablosu, yalnızca bir tür işleme izin verilen aşamalar (yani, saf bir yazma aşaması) ve ardından bir senkronizasyon tüm iş parçacıklarında tablo durumunun. Bunun için resmi olarak kanıtlanmış bir algoritma Shun ve Blelloch tarafından verilmektedir.[2]

Oku-Kopyala-Güncelle

İçinde yaygın olarak kullanılır Linux çekirdeği,[3] oku-kopyala-güncelle (RCU) özellikle okuma sayısının yazma sayısını çok aştığı durumlarda kullanışlıdır.[4]

Başvurular

Doğal olarak, eşzamanlı karma tablolar, sıralı karma tabloların yararlı olduğu her yerde uygulama bulur. Eşzamanlılığın burada sağladığı avantaj, bu kullanım durumlarının potansiyel hızlanmasının yanı sıra artan ölçeklenebilirlikte yatmaktadır.[1] Gibi donanımları göz önünde bulundurarak çok çekirdekli işlemciler giderek daha fazla eşzamanlı hesaplama yeteneğine sahip hale gelen bu uygulamalar, bu uygulamalardaki eşzamanlı veri yapılarının önemi giderek artmaktadır.[3]

Performans analizi

Maier vd.[1] Çeşitli eşzamanlı karma tablo uygulamaları üzerinde kapsamlı bir analiz gerçekleştirerek, her birinin gerçek kullanım durumlarında meydana gelmesi muhtemel farklı durumlarda etkinliği hakkında fikir edin. En önemli bulgular şu şekilde özetlenebilir:

OperasyonÇekişmeNotlar
DüşükYüksek
bulmakÇok yüksek çekişmelerle bile hem başarılı hem de başarısız benzersiz bulgular olduğunda çok yüksek hızlanma
eklemekYüksek hızlara ulaşıldı, anahtarlar birden fazla değer tutabildiğinde yüksek çekişme sorunlu hale gelir (aksi takdirde anahtar zaten mevcutsa ekler atılır)
GüncellemeMevcut değerlerin hem üzerine yazılması hem de değiştirilmesi, çekişme düşük tutulduğunda yüksek hızlara ulaşır, aksi takdirde sıralı değerlerden daha kötü performans gösterir
silFaz eşzamanlılığı en yüksek ölçeklenebilirliğe ulaştı; Tam eşzamanlı uygulamalar nerede sil kullanır Güncelleme ile kukla unsurlar yakından geride kaldı

Beklendiği gibi, düşük çekişme her operasyonda olumlu davranışa yol açarken, yazı söz konusu olduğunda yüksek çekişme sorunlu hale gelir. Bununla birlikte, ikincisi, genel olarak yüksek bir çekişme sorunudur, burada eşzamanlı hesaplamanın faydası, yarışan erişimleri kısıtlayan eşzamanlılık kontrolü için doğal gereksinim nedeniyle reddedilir. Sonuçta ortaya çıkan ek yük, ideal sıralı versiyondan daha kötü performansa neden olur.Buna rağmen, eşzamanlı hash tabloları, bu tür yüksek çekişme senaryolarında bile, iyi tasarlanmış bir uygulamanın, avantajlarından yararlanarak hala çok yüksek hızlanmalara ulaşabileceğini gözlemlerken paha biçilmez olduğunu kanıtlamaktadır. eşzamanlı olarak veri okumak için eşzamanlılık.

Bununla birlikte, eşzamanlı karma tabloların gerçek kullanım durumları genellikle aynı işlemin sıraları değil, daha çok birden çok türün karışımıdır. eklemek ve bulmak işlemler kullanılırsa, eşzamanlı hash tablolarının hızlandırılması ve sonuçta ortaya çıkan faydası, özellikle gözlemlenirken daha belirgin hale gelir. bulmak ağır iş yükleri.

Nihayetinde, eşzamanlı bir hash tablosunun ortaya çıkan performansı, istenen uygulamaya bağlı olarak çeşitli faktörlere bağlıdır. Uygulamayı seçerken, gerekli miktarda genellik, çekişme yönetimi stratejileri ve istenen tablonun büyüklüğünün önceden belirlenip belirlenemeyeceği veya bunun yerine büyüyen bir yaklaşımın kullanılması gerektiğine dair bazı düşüncelerin belirlenmesi önemlidir.

Uygulamalar

  • libcuckoo, eşzamanlı hash tabloları sağlar C /C ++ eşzamanlı okuma ve yazma işlemlerine izin verir. Kitaplık GitHub'da mevcuttur.[10]
  • Threading Yapı Taşları için eşzamanlı sırasız haritalar sağlayın C ++ eşzamanlı ekleme ve geçişe izin veren ve benzer bir tarzda tutulan C ++ 11 std :: unordered_map arayüz. İçerisinde, eşzamanlı sıralanmamış bir haritada aynı anahtar için birden çok değerin var olmasına izin veren eşzamanlı sırasız çoklu haritalar bulunur.[11] Ek olarak, eşzamanlı sırasız harita üzerine inşa edilen ve ayrıca eşzamanlı silmeye izin veren ve yerleşik kilitleme içeren eşzamanlı karma haritalar sağlanır.[12]
  • Growt, eşzamanlı büyüyen hash tabloları sağlar C ++ sözde temelinde folklor uygulama. Büyümeyen bu uygulamaya dayalı olarak, çeşitli farklı büyüyen hash tabloları verilir. Bu uygulamalar, eşzamanlı okumalara, eklemelere, güncellemelere (özellikle anahtardaki mevcut değere dayalı olarak değerleri güncelleme) ve çıkarmalara ( mezar taşları ). Bunun ötesinde, temelinde varyantlar Intel TSX sağlanır. Kitaplık GitHub'da mevcuttur.[1][13]
  • folly eşzamanlı karma tablolar sağlar[14] için C ++ 14 ve sonra beklemesiz okuyucular ve kilit tabanlı sağlanması, parçalanmış yazarlar. GitHub sayfasında belirtildiği gibi, bu kitaplık aşağıdakiler için yararlı işlevsellik sağlar: Facebook.[15]
  • Junction, eşzamanlı hash tablolarının çeşitli uygulamalarını sağlar. C ++ Tablonun herhangi bir üye işlevi için iş parçacığı güvenliğini sağlamak için atomik işlemler temelinde. Kitaplık GitHub'da mevcuttur.[16]

Ayrıca bakınız

Referanslar

  1. ^ a b c d e f g h ben j k Maier, Tobias; Sanders, Peter; Dementiev, Roman (Mart 2019). "Eşzamanlı Karma Tablolar: Hızlı ve Genel (?)!". Paralel Hesaplamada ACM İşlemleri. New York, NY, ABD: ACM. 5 (4). Madde 16. doi:10.1145/3309206. ISSN  2329-4949.
  2. ^ a b c Shun, Julian; Blelloch, Guy E. (2014). "Determinizm için Faz-Eşzamanlı Karma Tablolar". SPAA '14: Algoritma ve mimarilerde Paralellik üzerine 26.ACM sempozyumunun bildirileri. New York: ACM. s. 96–107. doi:10.1145/2612669.2612687. ISBN  978-1-4503-2821-0.
  3. ^ a b c d e f Li, Xiaozhou; Andersen, David G .; Kaminsky, Michael; Freedman, Michael J. (2014). "Hızlı Eşzamanlı Guguklu Hashing için Algoritmik İyileştirmeler". Dokuzuncu Avrupa Bilgisayar Sistemleri Konferansı Bildirileri. EuroSys '14. New York: ACM. Madde 27. doi:10.1145/2592798.2592820. ISBN  978-1-4503-2704-6.
  4. ^ a b Triplett, Josh; McKenney, Paul E .; Walpole Jonathan (2011). "Göreli Programlama ile Yeniden Boyutlandırılabilir, Ölçeklenebilir, Eşzamanlı Karma Tablolar". USENIXATC'11: USENIX yıllık teknik konferansı üzerine 2011 USENIX konferansının bildirileri. Berkeley, CA: USENIX Derneği. s. 11.
  5. ^ Herlihy, Maurice; Shavit, Nir (2008). "Bölüm 13: Eşzamanlı Karma ve Doğal Paralellik". Çok İşlemcili Programlama Sanatı. San Francisco, CA, ABD: Morgan Kaufmann Publishers Inc. s. 316–325. ISBN  978-0-12-370591-4.
  6. ^ a b Fan, Bin; Andersen, David G .; Kaminsky, Michael (2013). "MemC3: Dumber Caching ve Daha Akıllı Hashing ile Kompakt ve Eşzamanlı MemCache". nsdi'13: Ağa Bağlı Sistem Tasarımı ve Uygulamasıyla ilgili 10. USENIX Konferansı Bildirileri. Berkeley, CA: USENIX Derneği. sayfa 371–384.
  7. ^ Zhang, Kai; Wang, Kaibo; Yuan, Yuan; Guo, Lei; Lee, Rubao; ve Zhang, Xiaodong (2015). "Mega-KV: GPU'ların bellek içi anahtar-değer depolarının verimini en üst düzeye çıkarması için bir durum ". VLDB Endowment Bildirileri, Cilt. 8, No. 11, 2015.
  8. ^ Chu, Ching-Hsing; Potluri, Sreeram; Goswami, Anshuman; Venkata, Manjunath Gorentla; İmam, Neenaand; ve Newburn, Chris J. (2018) "Kalıcı GPU çekirdekleri ve OPENSHMEM ile yüksek performanslı bellek içi anahtar-değer işlemleri tasarlama "..
  9. ^ Java ConcurrentHashMap belgeleri
  10. ^ Libcuckoo için GitHub deposu
  11. ^ Threading Building Blocks concurrent_unordered_map ve concurrent_unordered_multimap belgeleri
  12. ^ Threading Building Blocks concurrent_hash_map belgeleri
  13. ^ Growt için GitHub deposu
  14. ^ Folly'de eşzamanlı hash haritalarının uygulanması için GitHub sayfası
  15. ^ Çılgınlık için GitHub deposu
  16. ^ Junction için GitHub deposu

daha fazla okuma

  • Herlihy, Maurice; Shavit, Nir (2008). "Bölüm 13: Eşzamanlı Karma ve Doğal Paralellik". Çok İşlemcili Programlama Sanatı. San Francisco, CA, ABD: Morgan Kaufmann Publishers Inc. s. 299–328. ISBN  978-0-12-370591-4.