Tensör İşleme Birimi - Tensor Processing Unit

Tensör İşleme Birimi
TasarımcıGoogle
TanıtıldıMayıs 2016
TürSinir ağı
Makine öğrenme
Tensör İşleme Birimi 3.0
Tensör İşleme Birimi 3.0

Tensör İşleme Birimi (TPU) bir AI hızlandırıcı Uygulamaya Özel Entegre Devre (ASIC) tarafından geliştirilmiştir Google Özellikle için sinir ağı makine öğrenme, özellikle Google'ın kendi TensorFlow yazılım.[1] Google, TPU'ları 2015 yılında dahili olarak kullanmaya başladı ve 2018'de bunları hem bulut altyapısının bir parçası olarak hem de çipin daha küçük bir sürümünü satışa sunarak üçüncü tarafların kullanımına sundu.

Genel Bakış

Tensör işleme birimi, Mayıs 2016'da Google I / O, şirket TPU'nun kendi cihazlarında zaten kullanıldığını söylediğinde veri merkezleri bir yıldan uzun bir süredir.[2][3] Çip, özellikle Google’ın TensorFlow çerçeve, sembolik bir matematik kütüphanesi için kullanılan makine öğrenme Gibi uygulamalar nöral ağlar.[4] Ancak, 2017 itibariyle Google hala CPU'lar ve GPU'lar diğer türler için makine öğrenme.[2] Diğer AI hızlandırıcı tasarımlar diğer satıcılardan da geliyor ve hedefleniyor gömülü ve robotik pazarlar.

Google'ın TPU'ları tescillidir. Bazı modeller ticari olarak mevcuttur ve 12 Şubat 2018'de, New York Times Google'ın "bulut bilişim hizmeti aracılığıyla diğer şirketlerin bu çiplere erişim satın almasına izin vereceğini" bildirdi.[5] Google, bunların kullanıldığını söyledi AlphaGo, Lee Sedol'e Karşı insan-makine serisi Git oyunlar,[3] yanı sıra AlphaZero üretilen sistem Satranç, Shogi ve sadece oyun kurallarından programlar oynamaya gidin ve bu oyunlarda önde gelen programları yenmeye devam edin.[6] Google ayrıca TPU'ları Google Sokak Görünümü metin işleme ve Street View veritabanındaki tüm metni beş günden kısa bir sürede bulabilmiştir. İçinde Google Fotoğraflar, tek bir TPU günde 100 milyondan fazla fotoğrafı işleyebilir. Ayrıca kullanılır RankBrain Google'ın arama sonuçları sağlamak için kullandığı.[7]

A ile karşılaştırıldığında Grafik İşleme Ünitesi, yüksek hacimli düşük hassasiyetli hesaplama için tasarlanmıştır (örneğin 8 bit hassas)[8] başına daha fazla giriş / çıkış işlemi ile joule ve tarama için donanımdan yoksundur /doku eşleme.[3] TPU ASIC'ler bir veri merkezindeki sabit sürücü yuvasına sığabilen bir soğutucu düzeneğine monte edilir raf, göre Norman Jouppi.[2]

Ürün:% s

TPUv1TPUv2TPUv3TPUv4[9]Edge v1
Tanıtıldığı Tarih20162017201820202018
İşlem Düğümü28 nm20 nm?12nm??
Kalıp Boyutu (mm2)331???
Çip hafızasında (MiB)28???
Saat Hızı (MHz)700???
Bellek (GB)8 GB DDR316 GB HBM32 GB HBM?
TDP (W)40200250?2
TOPS234590?4

Birinci nesil TPU

Birinci nesil TPU, bir 8 bit matris çarpımı motor CISC talimatları ana işlemci tarafından bir PCIe 3.0 otobüs. Üzerinde üretilmektedir. 28 nm kalıp boyutu ≤ 331 ile işlemmm2. saat hızı 700MHz ve bir termal tasarım gücü 28–40 arasındaW. 28 tane varMiB yonga hafızasında ve 4MiB nın-nin 32 bit akümülatörler 256 × 256 sonuçlarını alarak sistolik dizi 8 bitlik çarpanlar.[10] TPU paketi içinde 8GiB nın-nin çift ​​kanal 2133 MHz DDR3 SDRAM 34 GB / s bant genişliği sunar.[11] Talimatlar verileri ana bilgisayara veya ana bilgisayardan aktarır, matris çarpımlarını gerçekleştirir veya kıvrımlar ve uygula aktivasyon fonksiyonları.[10]

İkinci nesil TPU

İkinci nesil TPU, Mayıs 2017'de duyuruldu.[12] Google, birinci nesil TPU tasarımının aşağıdakilerle sınırlı olduğunu belirtti: bellek bant genişliği ve 16 kullanarak GB nın-nin Yüksek Bant Genişlikli Bellek ikinci nesil tasarımda bant genişliğini 600 GB / sn'ye ve performansı 45 tera'ya yükselttiFLOPS.[11] TPU'lar daha sonra 180 teraFLOPS performansıyla dört yongalı modüller halinde düzenlenir.[12] Daha sonra bu modüllerden 64 tanesi, 11,5 petaFLOPS performansa sahip 256 yongalı bölmelere birleştirilir.[12] Özellikle, birinci nesil TPU'lar tam sayılarla sınırlıyken, ikinci nesil TPU'lar da hesaplama yapabilir kayan nokta. Bu, ikinci nesil TPU'ları makine öğrenimi modellerinin hem eğitimi hem de çıkarımı için kullanışlı hale getirir. Google, bu ikinci nesil TPU'ların Google Compute Engine TensorFlow uygulamalarında kullanım için.[13]

Üçüncü nesil TPU

Üçüncü nesil TPU, 8 Mayıs 2018'de duyuruldu.[14] Google, işlemcilerin kendilerinin ikinci nesil TPU'lardan iki kat daha güçlü olduğunu ve önceki nesle göre dört kat daha fazla yonga ile bölmelerde konuşlandırılacağını duyurdu.[15][16] Bu, ikinci nesil TPU dağıtımına kıyasla, bölme başına performansta 8 kat artış (bölme başına 1.024'e kadar yonga) ile sonuçlanır.

Edge TPU

Temmuz 2018'de Google, Edge TPU'yu duyurdu. Edge TPU, Google'ın amaca yönelik ASIC makine öğrenimi (ML) modellerini çalıştırmak için tasarlanmış çip uç hesaplama yani Google veri merkezlerinde barındırılan TPU'lara kıyasla çok daha küçüktür ve çok daha az güç tüketir (aynı zamanda Cloud TPU'lar ). Ocak 2019'da Google, Edge TPU'yu geliştiricilere aşağıdaki ürün yelpazesiyle sunmuştur: Mercan marka. Edge TPU, 2W kullanırken saniyede 4 trilyon işlem kapasitesine sahiptir.[17]

Ürün teklifleri şunları içerir: tek kartlı bilgisayar (SBC), bir modül üzerindeki sistem (SoM), bir USB aksesuar, mini PCI-e kart ve bir M.2 kart. SBC Coral Dev Kurulu ve Coral SoM ikisi de Mendel Linux OS çalıştırır - bir türevi Debian. USB, PCI-e ve M.2 ürünleri, mevcut bilgisayar sistemlerine eklenti olarak işlev görür ve x86-64 ve ARM64 ana bilgisayarlarında Debian tabanlı Linux sistemlerini destekler ( Ahududu Pi ).

Edge TPU'da modelleri yürütmek için kullanılan makine öğrenimi çalışma zamanı, TensorFlow Lite.[18] Edge TPU yalnızca ileri geçiş işlemlerini hızlandırabilir; bu, öncelikle çıkarımlar yapmak için yararlı olduğu anlamına gelir (Edge TPU'da hafif aktarım öğrenimi gerçekleştirmek mümkün olsa da)[19]). Edge TPU ayrıca yalnızca 8 bit matematiği destekler, yani bir ağın Edge TPU ile uyumlu olması için TensorFlow kullanılarak eğitilmesi gerekir. nicelemeye duyarlı eğitim tekniği veya 2019'un sonlarından beri kullanmak da mümkündür eğitim sonrası niceleme.

12 Kasım 2019'da, Asus bir çift ilan etti tek kartlı bilgisayar (SBC'ler) Edge TPU'ya sahip. Asus Tinker Edge T ve Tinker Edge R Kartı için tasarlandı IoT ve kenar AI. SBCs desteği Android ve Debian işletim sistemleri.[20][21] ASUS ayrıca Edge TPU içeren Asus PN60T adlı bir mini PC de tanıttı.[22]

2 Ocak 2020'de Google, Coral Accelerator Module ve Coral Dev Board Mini'yi CES 2020 aynı ay sonra. Coral Hızlandırıcı Modülü bir çoklu çip modülü Daha kolay entegrasyon için Edge TPU, PCIe ve USB arayüzlerine sahiptir. Coral Dev Board Mini daha küçük SBC Coral Hızlandırıcı Modülüne sahiptir ve MediaTek 8167s SoC.[23][24]

Piksel Sinir Çekirdeği

15 Ekim 2019'da Google, Piksel 4 sahip akıllı telefon Piksel Sinir Çekirdeği, Edge TPU mimarisinin bir örneğini içeren.[25]

Ayrıca bakınız

Referanslar

  1. ^ "Cloud Tensor İşleme Birimleri (TPU'lar)". Google Cloud. Alındı 20 Temmuz 2020.
  2. ^ a b c "Google'ın Tensor İşleme Birimi açıkladı: bilgi işlemin geleceği böyle görünüyor". TechRadar. Alındı 2017-01-19.
  3. ^ a b c Jouppi, Norm (18 Mayıs 2016). "Google, TPU özel yongasıyla makine öğrenimi görevlerini güçlendiriyor". Google Cloud Platform Blogu. Alındı 2017-01-22.
  4. ^ "TensorFlow: Açık kaynak makine öğrenimi" "Çeşitli algısal ve dil anlama görevleri için kullanılan makine öğrenimi yazılımıdır" - Jeffrey Dean, dakika 0:47 / 2:17 Youtube klibinden
  5. ^ "Google, Özel Yapay Zeka Yongalarını Başkalarının Kullanımına Sunuyor". New York Times. Alındı 2018-02-12.
  6. ^ McGourty, Colin (6 Aralık 2017). "DeepMind's AlphaZero satrancı eziyor". chess24.com.
  7. ^ "Google'ın Tensör İşleme Birimi, Moore Yasasını 7 yıl ileriye taşıyabilir". Bilgisayar Dünyası. Alındı 2017-01-19.
  8. ^ Armasu, Lucian (2016-05-19). "Google'ın Büyük Çipi Makine Öğrenimi İçin Açıkladı: 10 Kat Daha Yüksek Verimliliğe Sahip Tensör İşleme Birimi (Güncellenmiş)". Tom'un Donanımı. Alındı 2016-06-26.
  9. ^ Bizi izlemeye devam edin, TPU v4 hakkında daha fazla bilgi yakında sunulacak Erişim tarihi: 2020-08-06.
  10. ^ a b Jouppi, Norman P .; Genç, Uçurum; Patil, Nishant; Patterson, David; Agrawal, Gaurav; Bajwa, Raminder; Bates, Sarah; Bhatia, Suresh; Boden, Nan; Borchers, Al; Boyle, Rick; Cantin, Pierre-luc; Chao, Clifford; Clark, Chris; Coriell, Jeremy; Daley, Mike; Dau, Matt; Dean, Jeffrey; Gelb, Ben; Ghaemmaghami, Tara Vazir; Gottipati, Rajendra; Gulland, William; Hagmann, Robert; Ho, C. Richard; Hogberg, Doug; Hu, John; Hundt, Robert; Canım Dan; Ibarz, Julian; Jaffey, Aaron; Jaworski, Alek; Kaplan, Alexander; Khaitan, Harshit; Koch, Andy; Kumar, Naveen; Dantelli Steve; Laudon, James; Hukuk, James; Le, Diemthu; Leary, Chris; Liu, Zhuyuan; Lucke, Kyle; Lundin, Alan; MacKean, Gordon; Maggiore, Adriana; Mahony, Maire; Miller, Kieran; Nagarajan, Rahul; Narayanaswami, Ravi; Ni, Ray; Nix, Kathy; Norrie, Thomas; Omernick, Mark; Penukonda, Narayana; Phelps, Andy; Ross, Jonathan; Ross, Matt; Salek, Amir; Samadiani, Emad; Severn, Chris; Sizikov, Gregory; Snelham, Matthew; Souter, Jed; Steinberg, Dan; Salın, Andy; Tan, Mercedes; Thorson, Gregory; Tian, ​​Bo; Toma, Horia; Tuttle, Erick; Vasudevan, Vijay; Walter, Richard; Wang, Walter; Wilcox, Eric; Yoon, Doe Hyun (26 Haziran 2017). Tensor Processing Unit ™ için Veri Merkezi İçi Performans Analizi. Toronto Kanada. arXiv:1704.04760.
  11. ^ a b Kennedy, Patrick (22 Ağustos 2017). "Hot Chips 29'dan Google TPU ve GDDR5 hakkında Örnek Olay". Eve Servis Yapın. Alındı 23 Ağustos 2017.
  12. ^ a b c Bright, Peter (17 Mayıs 2017). "Google, bilgi işlem bulutuna 45 teraflop tensör akış işlemcisi getiriyor". Ars Technica. Alındı 30 Mayıs 2017.
  13. ^ Kennedy, Patrick (17 Mayıs 2017). "Google Cloud TPU Ayrıntıları Açıklandı". Eve Servis Yapın. Alındı 30 Mayıs 2017.
  14. ^ Frumusanu, Andre (8 Mayıs 2018). "Google I / O Açılış Keynote Live-Blogu". Alındı 9 Mayıs 2018.
  15. ^ Feldman, Michael (11 Mayıs 2018). "Google, Üçüncü Nesil TPU İşlemciye Bakış Sunuyor". İlk 500. Alındı 14 Mayıs 2018.
  16. ^ Teich, Paul (10 Mayıs 2018). "Google'ın TPU 3.0 AI Yardımcı İşlemcisini Parçalamak". Sonraki Platform. Alındı 14 Mayıs 2018.
  17. ^ "Edge TPU performans testleri". Mercan. Alındı 2020-01-04.
  18. ^ "Cloud IoT ile zekayı uca getirin". Google Blogu. 2018-07-25. Alındı 2018-07-25.
  19. ^ "Cihazda bir görüntü sınıflandırma modelini yeniden eğitin". Mercan. Alındı 2019-05-03.
  20. ^ "組 込 み 総 合 技術 展 & IoT 総 合 技術 展「 ET ve IoT Teknolojisi 2019 」に 出 展 す る こ と を 発 表". Asus.com (Japonyada). Alındı 2019-11-13.
  21. ^ Shilov, Anton. "ASUS ve Google, 'Tinker Board' Yapay Zeka Odaklı Kredi Kartı Büyüklüğünde Bilgisayarlar İçin Birleşti". Anandtech.com. Alındı 2019-11-13.
  22. ^ Aufranc, Jean-Luc (2019-05-29). "Google Coral Edge TPU ve NXP i.MX 8M İşlemciye Sahip ASUS Tinker Edge T & CR1S-CM-A SBC". CNX Yazılımı - Gömülü Sistem Haberleri. Alındı 2019-11-14.
  23. ^ "2020 için yeni Coral ürünleri". Google Developers Blogu. Alındı 2020-01-04.
  24. ^ "Hızlandırıcı Modülü". Mercan. Alındı 2020-01-04.
  25. ^ "Yeni Nesil Cihaz Üzerinde Görüntü Modellerinin Tanıtımı: MobileNetV3 ve MobileNetEdgeTPU". Google AI Blogu. Alındı 2020-04-16.

Dış bağlantılar