Larrabee (mikro mimari) - Larrabee (microarchitecture)

Larrabee GPU mimarisi, SIGGRAPH Ağustos 2008'de konferans.

Larrabee ... kod adı iptal edilmiş için GPGPU yonga onu Intel kendisinden ayrı gelişiyordu mevcut entegre grafik hızlandırıcıları serisi. Adını almıştır Larrabee Eyalet Parkı Whatcom County, Washington, Bellingham kasabası yakınlarında. Çip, tüketici 3D grafik kartının çekirdeği olarak 2010 yılında piyasaya sürülecekti, ancak bu planlar gecikmeler ve hayal kırıklığı yaratan erken performans rakamları nedeniyle iptal edildi.[1][2] Doğrudan Larrabee araştırma projesinden bir GPU perakende ürünü üretme projesi Mayıs 2010'da sona erdirildi[3] ve teknolojisi, Xeon Phi. Intel MIC 2010'da duyurulan çok işlemcili mimari, Larrabee projesinden birçok tasarım öğesini devraldı, ancak bir grafik işleme birimi olarak işlev görmüyor; ürün, yüksek performanslı bilgi işlem için bir yardımcı işlemci olarak tasarlanmıştır.

Neredeyse on yıl sonra, 12 Haziran 2018'de; Intel'e özel bir GPU fikri yeniden canlandırıldı ( Intel Xe ) Intel'in 2020'de piyasaya sürülecek ayrı bir GPU oluşturma arzusuyla.[4] Ancak, bu yeni gelişmenin Larabee'nin gelişmeleriyle bağlantılı olup olmadığı belirsizliğini koruyor.

Proje durumu

4 Aralık 2009'da Intel, birinci nesil Larrabee'nin bir tüketici GPU ürünü olarak piyasaya sürülmeyeceğini resmen duyurdu.[5] Bunun yerine, grafikler için bir geliştirme platformu olarak piyasaya sürülecekti ve yüksek performanslı bilgi işlem. Stratejik sıfırlamanın resmi nedeni, donanım ve yazılım geliştirmedeki gecikmelere atfedildi.[6] 25 Mayıs 2010'da Technology @ Intel blogu, Larrabee'nin bir GPU olarak piyasaya sürülmeyeceğini, bunun yerine yüksek performanslı bilgi işlem için bir ürün olarak piyasaya sürüleceğini duyurdu. Nvidia Tesla.[7]

Doğrudan Larrabee araştırma projesinden bir GPU perakende ürünü üretme projesi Mayıs 2010'da sona erdirildi.[3] Intel MIC 2010'da duyurulan çok işlemcili mimari, Larrabee projesinden birçok tasarım öğesini devraldı, ancak bir grafik işleme birimi olarak işlev görmüyor; ürün, yüksek performanslı bilgi işlem için bir yardımcı işlemci olarak tasarlanmıştır. Prototip kartın adı verildi Knights Feribotu, 22 nm'lik bir süreçle oluşturulmuş bir üretim kartı Şövalyeler Köşesi 2012 veya daha sonra üretim için planlandı.[kaynak belirtilmeli ]

Rakip ürünlerle karşılaştırma

Intel'e göre Larrabee, yalnızca kısmen programlanabilen mevcut nesil grafik kartlarının aksine tamamen programlanabilir bir iletişim hattına sahip.

Larrabee, bir melez olarak düşünülebilir. çok çekirdekli İşlemci ve bir GPU ve her ikisine de benzerlik gösterir. Onun tutarlı önbellek hiyerarşi ve x86 mimarisi uyumluluk CPU'ya benzer, ancak geniş SIMD vektör birimleri ve doku örnekleme donanımı GPU gibidir.

Bir GPU olarak Larrabee, geleneksel rasterleştirmeyi desteklerdi 3D grafikler (Direct3D & OpenGL ) oyunlar için. Bununla birlikte, CPU ve GPU özelliklerinin hibritleşmesi de aşağıdakiler için uygun olmalıdır: genel amaçlı GPU (GPGPU) veya akış işleme görevler. Örneğin, gerçekleştirilmiş olabilir Işın izleme veya fizik işleme,[8] içinde gerçek zaman oyunların bir bileşeni olarak bilimsel araştırma için veya çevrimdışı Süper bilgisayar.[9]

Larrabee'nin ilk sunumu GPU rakiplerinden bazı eleştiriler aldı. Şurada: NVISION 08, bir Nvidia çalışan Intel'in SIGGRAPH Larrabee "pazarlama pufu" hakkında bir makale yazdı ve bir endüstri analistinden alıntı yaptı (Peter Glaskowsky ) Larrabee mimarisinin "bir GPU 2006'dan itibaren ".[10] Haziran 2009'da Intel, Larrabee'nin prototiplerinin, Nvidia GeForce GTX 285.[11] Justin Rattner, Intel CTO, 17 Kasım 2009'da Supercomputing 2009 konferansında bir açılış konuşması yaptı. Konuşması sırasında, performansta bir teraFLOPS'un üzerinde hız aşırtmalı Larrabee işlemciyi gösterdi. Bunun, bir teraFLOPS'u aşan tek çipli bir sistemin ilk halka açık gösterimi olduğunu iddia etti. Bunun erken silikon olduğuna dikkat çekerek mimarinin nihai performansı sorusunu açık bıraktı. Bu, mevcut rakip grafik kartlarının yalnızca beşte biri olduğu için, Larrabee 4 Aralık 2009'da "bağımsız bir ayrık grafik ürünü" olarak iptal edildi.[1]

Çağdaş GPU'larla farklılıklar

Larrabee'nin aşağıdaki gibi daha eski ayrı GPU'lardan farklı olması amaçlanmıştır. GeForce 200 Serisi ve Radeon 4000 serisi üç ana yoldan:

Bunun Larrabee'yi mevcut GPU'lardan daha esnek hale getirmesi ve oyunlar veya diğer 3D uygulamalar arasında görünümde daha fazla farklılığa izin vermesi bekleniyordu. Intel'in SIGGRAPH 2008 kağıt, mevcut GPU'larda elde edilmesi zor olan birkaç oluşturma özelliğinden bahsetti: oluşturma hedefi okuma, siparişten bağımsız şeffaflık, düzensiz gölge eşleme ve gerçek zamanlı Işın izleme.[12]

ATI'ler gibi daha yeni GPU'lar Radeon HD 5xxx ve Nvidia'nın GeForce 400 Serisi DirectX11 DirectCompute ve OpenCL aracılığıyla giderek daha geniş genel amaçlı bilgi işlem yeteneklerinin yanı sıra Nvidia'nın tescilli CUDA teknoloji, Larrabee'nin birçok yeteneğini onlara veriyor.

CPU'larla farklılıklar

Larrabee'deki x86 işlemci çekirdekleri, aşağıdaki gibi mevcut Intel CPU'lardaki çekirdeklerden birkaç yönden farklıydı. Core 2 Duo veya Core i7:

  • X86 çekirdekleri çok daha basit P54C Pentium kullanım için hala muhafaza edilen tasarım gömülü uygulamalar.[13] P54C'den türetilmiş çekirdek süper skalar ama içermez sıra dışı yürütme gibi modern özelliklerle güncellenmiş olsa da x86-64 destek,[12] benzer Bonnell mikromimarisi kullanılan Atom. Sıralı yürütme, tek tek çekirdekler için daha düşük performans anlamına gelir, ancak daha küçük oldukları için tek bir yongaya daha fazla sığabilir ve genel verim artar. Yürütme ayrıca daha belirleyicidir, bu nedenle talimat ve görev zamanlaması derleyici tarafından yapılabilir.
  • Her çekirdek bir 512 bit içeriyordu vektör işleme birim, bir seferde 16 tek hassas kayan nokta numarasını işleyebilir. Bu, benzer, ancak bundan dört kat daha büyüktür. SSE çoğu x86 işlemcisindeki birimler, aşağıdaki gibi ek özelliklerle dağıtmak / toplamak vektör birimini daha kolay ve verimli hale getirmek için tasarlanmış talimatlar ve bir maske kaydı. Larrabee, sayı hesaplama gücünün çoğunu bu vektör birimlerinden elde edecekti.[12]
  • Bir majör içeriyordu sabit işlevli grafik donanımı özelliği: doku örnekleme birimleri. Bunlar performans üç çizgili ve anizotropik filtreleme ve doku dekompresyonu.[12]
  • Çekirdekler arasında ve bellekle iletişim için 1024 bitlik (her yönden 512 bitlik) halka veriyoluna sahipti.[12] Bu veri yolu, 16 veya daha fazla çekirdekli veya 16'dan az çekirdekli Larrabee ürünlerini desteklemek için iki modda yapılandırılabilir.[14]
  • Azaltmak için açık önbellek kontrol talimatlarını içeriyordu önbellek bozma yalnızca bir kez veri okuyan / yazan akış işlemleri sırasında.[12] L2 veya L1 önbelleğine açık önceden getirme de desteklenir.
  • Her çekirdek, her birinin dört kopyası ile dört yollu aralıklı çok iş parçacıklı okumayı destekler işlemci kaydı.[12]

Teorik olarak Larrabee'nin x86 işlemci çekirdekleri, mevcut PC yazılımlarını ve hatta işletim sistemlerini çalıştırabilirdi. İşlemcinin farklı bir sürümü, ana kart CPU soketlerinde QuickPath,[15] ancak Intel bunun için herhangi bir plan açıklamadı. Larrabee'nin yerel C / C ++ derleyicisinin otomatik vektörleştirme içermesine ve birçok uygulamanın yeniden derlendikten sonra doğru şekilde çalıştırılabilmesine rağmen, maksimum verimliliğin C ++ vektör içsellerini veya satır içi Larrabee montaj kodunu kullanarak gerekli kod optimizasyonuna sahip olması bekleniyordu.[12] Bununla birlikte, tüm GPGPU'larda olduğu gibi, tüm yazılımlar bir vektör işleme biriminin kullanımından yararlanamazdı. Bir teknoloji gazeteciliği sitesi, Larrabee'nin grafik yeteneklerinin CPU'lara entegre edilmesinin planlandığını iddia ediyor. Haswell mikromimarisi.[16]

Hücre geniş bant motoru ile karşılaştırma

Larrabee'nin birçok küçük, basit çekirdek kullanma felsefesi, Hücre işlemcisi. Çekirdekler arasında iletişim kurmak için yüksek bant genişliğine sahip bir halka veriyolunun kullanılması gibi bazı başka ortak noktalar da vardır.[12] Bununla birlikte, Larrabee'yi programlamayı daha basit hale getirmesi beklenen uygulamada birçok önemli fark vardı.

  • Cell işlemci, birçok küçük işlemciyi kontrol eden bir ana işlemci içerir. Ek olarak, ana işlemci bir işletim sistemi çalıştırabilir. Buna karşılık, Larrabee'nin tüm çekirdekleri aynı ve Larrabee'nin bir işletim sistemi çalıştırması beklenmiyordu.
  • Hücredeki her bilgisayar çekirdeği (SPE ) yerel bir mağazaya sahip, bunun için açık (DMA ) işlemler DRAM'a tüm erişimlerde kullanılır. DRAM'a normal okuma ve yazma işlemlerine izin verilmez. Larrabee'de, tüm yonga üstü ve yonga dışı bellekler otomatik olarak yönetilen tutarlı önbellek hiyerarşisi, böylece çekirdeklerinin standart kopya (MOV ) Talimatlar. Larrabee çekirdeklerinin her biri 256 KB yerel L2 önbelleğine sahipti ve başka bir L2 segmentine ulaşan erişimin erişimi daha uzun sürüyordu.[12]
  • Yukarıda belirtilen önbellek tutarlılığı nedeniyle, Larrabee'de çalışan her program, tıpkı geleneksel genel amaçlı CPU'da olduğu gibi neredeyse büyük bir doğrusal belleğe sahipti; Hücre için bir uygulama, her SPE ile ilişkili yerel deponun sınırlı bellek ayak izi dikkate alınarak programlanmalıdır (ayrıntılar için bkz. Bu makale ) ancak teorik olarak daha yüksek bant genişliğine sahip. Bununla birlikte, yerel L2'ye erişim daha hızlı olduğundan, Hücre tarzı programlama yöntemlerinin kullanılmasıyla yine de bir avantaj elde edilebilir.[kaynak belirtilmeli ]
  • Hücre kullanımları DMA yerel bellekte depolanan kaplamaların açık bakımını sağlayarak belleği çekirdeğe yaklaştırmak ve erişim gecikmelerini azaltmak için, ancak ana bellekle tutarlılığı korumak için ek çaba gerektiren yonga üzerindeki yerel belleklere ve bu belleklerden veri aktarımı için; Larrabee, önbellek manipülasyonu için özel talimatlar (özellikle önbellek çıkarma ipuçları ve önceden getirme talimatları) içeren tutarlı bir önbellek kullandığından, kaçırma ve tahliye cezalarını azaltır ve önbellek kirliliğini azaltır (örneğin, ardışık düzenleri ve diğer akış benzeri hesaplamaları oluşturmak için) önbellek tutarlılığını korumak için ek trafik ve ek yük.[12]
  • Hücredeki her hesaplama çekirdeği sırayla bir seferde yalnızca bir iş parçacığı çalıştırır. Larrabee'deki bir çekirdek dört iş parçacığına kadar çalıştı, ancak bir seferde yalnızca bir tane. Larrabee'nin hiper iş parçacığı, sıralı yürütmenin doğasında bulunan gecikmeleri gizlemeye yardımcı oldu.[kaynak belirtilmeli ]

Intel GMA ile Karşılaştırma

Intel, bir dizi GPU'yu ana kartlara entegre etmeye başladı. Intel GMA Anakartlara entegre edildiğinden (Sandy Bridge ile piyasaya sürülenler gibi daha yeni sürümler CPU ile aynı kalıba dahil edilmiştir) bu yongalar ayrı olarak satılmadı. Düşük maliyetli olmasına rağmen ve güç tüketimi Intel GMA yongaları onları küçük dizüstü bilgisayarlar ve daha az zorlu görevler için uygun hale getirdi, üst düzey oyun bilgisayarı pazarının bir payı için çağdaş Nvidia ve AMD / ATI GPU'larla rekabet edecek 3B grafik işleme gücünden yoksundurlar. HPC pazar veya popüler bir yer video oyun konsolları. Buna karşılık Larrabee, anakartlardan ayrı ayrı bir GPU olarak satılacaktı ve gelecek nesil video oyun konsollarında dikkate alınacak kadar iyi performans göstermesi bekleniyordu.[17][18]

Larrabee üzerinde çalışan ekip, Intel GMA ekibinden ayrıydı. Donanım, Intel’de yeni kurulan bir ekip tarafından tasarlandı. Hillsboro, Oregon site, tasarlayanlardan ayrı Nehalem. Yazılım ve sürücüler yeni oluşturulan bir ekip tarafından yazılmıştır. 3D yığın özellikle geliştiriciler tarafından şu adrese yazılmıştır: RAD Oyun Araçları (dahil olmak üzere Michael Abrash ).[19]

Intel Görsel Hesaplama Enstitüsü, Larrabee tabanlı ürünlere uygulanabilecek temel ve uygulamalı teknolojileri araştıracak.[20]

Öngörülen performans verileri

Kıyaslama 2008 sonuçları İşlem çekirdeği sayısının yaklaşık doğrusal fonksiyonu olarak tahmin edilen performansı gösteren SIGGRAPH kağıdı

Intel'in SIGGRAPH 2008 makalesi açıklıyor döngüsel doğru simülasyonlar Larrabee'nin öngörülen performansının (bellek, önbellek ve doku birimlerinin sınırlamaları dahil edildi).[12] Grafikler, birçok popüler oyunda 1600 × 1200 çözünürlükte 60 kare / s'yi korumak için kaç adet 1 GHz Larrabee çekirdeğinin gerekli olduğunu göstermektedir. Aşağıdakiler için kabaca 25 çekirdek gereklidir Gears of War kenar yumuşatma içermeyen, 25 çekirdek KORKU 4 × kenar yumuşatma ve 10 çekirdek Half-Life 2: Bölüm 2 4 × kenar yumuşatma ile. Intel, Larrabee'nin muhtemelen 1 GHz'den daha hızlı çalışacağını iddia etti, bu nedenle bu sayılar, bu türden sanal zaman dilimlerini değil, gerçek çekirdekleri temsil etmiyor. Başka bir grafik, bu oyunlardaki performansın 32 çekirdeğe kadar çekirdek sayısıyla neredeyse doğrusal olarak ölçeklendiğini gösteriyor. 48 çekirdekte performans, doğrusal ilişki devam ederse beklenenin% 90'ına düşer.[21]

Bir Haziran 2007 PC İzle makale, ilk Larrabee yongalarının 32 x86 işlemci çekirdeğine sahip olacağını ve 2009'un sonlarında piyasaya çıkacağını ileri sürdü. 45 nanometre süreci. Nedeniyle birkaç kusurlu çekirdeğe sahip çipler Yol ver sayılar 24 çekirdekli sürüm olarak satılacaktır. 2010 yılının sonlarında, Larrabee bir süre için küçültülecekti. 32 nanometre üretim süreci 48 çekirdekli bir sürümü etkinleştirmek için.[22]

Son performans ifadesi şu şekilde hesaplanabilir (teorik olarak bu mümkün olan maksimum performanstır): 32 çekirdek × 16 tek duyarlıklı kayan SIMD / çekirdek × 2 FLOP (kaynaştırılmış çoklu ekleme) × 2 GHz = 2 TFLOPS teorik olarak.

Halka açık gösteriler

Larrabee mimarisinin halka açık bir gösterimi, Intel Geliştirici Forumu San Francisco'da 22 Eylül 2009'da. Eski CPU tabanlı araştırma projesi Quake Wars: Ray Traced'in erken bir limanı gerçek zamanlı olarak gösterildi. Sahne, bir gemi ve birkaç uçan araç gibi çevredeki nesneleri doğru bir şekilde yansıtan ışınla izlenen bir su yüzeyini içeriyordu.

İkinci bir demo, Intel CTO'nun açılış konuşması sırasında, 17 Kasım 2009'da Portland'daki SC09 konferansında verildi. Justin Rattner. Bir Larrabee kartı, SGEMM 4Kx4K hesaplamasında 1006 GFLop'a ulaşmayı başardı.

Larrabee kartının bir mühendislik örneği tedarik edildi ve incelendi Linus Sebastian 14 Mayıs 2018'de yayınlanan bir videoda. Ancak kartın video çıkışı vermesini sağlayamadı, ancak anakart POST kodu D6 gösteriyor.[23]

Ayrıca bakınız

Referanslar

  1. ^ a b Crothers, Brooke (4 Aralık 2009). "Intel: İlk Larrabee grafik yongası iptal edildi". CNET. CBS Interactive.
  2. ^ Charlie Demerjian (4 Aralık 2009). "Intel tüketici Larrabee'yi öldürür, gelecekteki varyantlara odaklanır - SemiAccurate". SemiAccurate.com. Alındı 9 Nisan 2017.
  3. ^ a b Smith, Ryan (25 Mayıs 2010). "Intel Larrabee GPU'yu Öldürdü, Ayrı Bir Grafik Ürününü Pazara Getirmeyecek". AnandTech.
  4. ^ Smith, Ryan (13 Haziran 2018). "Intel'in 2020 İçin İlk (Modern) Ayrık GPU Seti". Anandtech. Alındı 4 Kasım 2018.
  5. ^ Stokes, Jon (5 Aralık 2009). "Intel'in Larrabee GPU'su buza girdi, 2010'da daha fazla haber gelecek". Ars Technica. Övmek.
  6. ^ Smith, Ryan. "Intel Larrabee Perakende Ürünlerini İptal Etti, Larrabee Projesi Devam Ediyor". AnandTech.com. Alındı 9 Nisan 2017.
  7. ^ "Bloglar @ Intel - Intel Blogları". Intel.com. Alındı 9 Nisan 2017.
  8. ^ Stokes, Jon. "Intel, yakında çıkacak GPU ürünü için oyun fiziği motorunu alıyor". Ars Technica. Alındı 2007-09-17.
  9. ^ Stokes, Jon. "Intel'in Larrabee'si ile ilgili kafa karışıklığını gidermek". Ars Technica. Alındı 1 Haziran, 2007.
  10. ^ "Larrabee performansı - sesin ötesinde". CNet.com. Alındı 9 Nisan 2017.
  11. ^ "Intel'in 'Larrabee'si GeForce GTX 285 ile Eşitlikte". TomsHardware.com. 2 Haziran 2009. Alındı 9 Nisan 2017.
  12. ^ a b c d e f g h ben j k l m n Ö Seiler, L .; Cavin, D .; Espasa, E .; Grochowski, T .; Juan, M .; Hanrahan, P .; Carmean, S .; Sprangle, A .; Forsyth, J .; Abrash, R .; Dubey, R .; Junkins, E .; Lake, T .; Sugerman, P. (Ağustos 2008). "Larrabee: Görsel Hesaplama için Çok Çekirdekli bir x86 Mimarisi" (PDF). Grafiklerde ACM İşlemleri. ACM SIGGRAPH 2008 Bildirileri. 27 (3): 18:11. doi:10.1145/1360612.1360617. ISSN  0730-0301. Alındı 2008-08-06.
  13. ^ "Gizli Pentagon teknolojisine dayalı Intel Larrabee GPU, sorta [Güncellenmiş]". Ars Technica. Alındı 2008-08-06.
  14. ^ Glaskowsky, Peter. "Intel Larrabee - göründüğünden daha fazla ve daha az". CNET. Alındı 2008-08-20.
  15. ^ Stokes, Jon. "Intel Larrabee, bölüm II ile ilgili kafa karışıklığını gidermek". Ars Technica. Alındı 2008-01-16.
  16. ^ "Intel, Larrabee grafiklerini CPU'larda kullanacak - SemiAccurate". SemiAccurate.com. 19 Ağustos 2009. Alındı 9 Nisan 2017.
  17. ^ Chris Leyton (13 Ağustos 2008). "Intel'in Larrabee'si Yeni Nesil Konsollar İçin Şekilleniyor mu?". Arşivlenen orijinal 17 Ağustos 2008. Alındı 24 Ağustos 2008.
  18. ^ Charlie Demerjian (5 Şubat 2009). "Intel, PlayStation 4 GPU'yu Tasarlayacak". Alındı 28 Ağustos 2009.
  19. ^ Wilson, Anand Lal Shimpi ve Derek. "Intel'in Larrabee Mimarisi Açıklaması: Hesaplanan İlk Hareket". AnandTech.com. Alındı 9 Nisan 2017.
  20. ^ Ng, Jansen (13 Mayıs 2009). "Intel Görsel Hesaplama Enstitüsü Açıldı," Larrabee "Gelişimini Teşvik Edecek". DailyTech. Arşivlenen orijinal 16 Mayıs 2009. Alındı 13 Mayıs, 2009.
  21. ^ Steve Seguin (20 Ağustos 2008). "Intel'den 'Larrabee' AMD, Nvidia'yı Sarsacak". Tom'un Donanımı. Alındı 24 Ağustos 2008.
  22. ^ "Intel, 32 çekirdekli CPU'yu tanıtıyor" Larrabee"" (Japonyada). pc.watch.impress.co.jp. Alındı 6 Ağustos 2008.tercüme
  23. ^ Linus Tech İpuçları (2018-05-14), INTEL'İN PROTOTİP GRAFİK KARTINI BULDUK !!, alındı 2019-05-10

Dış bağlantılar