LeNet - LeNet

LeNet bir evrişimli sinir ağı tarafından önerilen yapı Yann LeCun et al. LeNet, genel olarak, lenet-5'i ifade eder ve basit bir evrişimli sinir ağı. Evrişimli sinir ağları bir tür ileri beslemeli sinir ağı yapay nöronları, kapsama alanındaki çevreleyen hücrelerin bir kısmına yanıt verebilen ve büyük ölçekli görüntü işlemede iyi performans gösterebilen.

Geliştirme geçmişi

LeNet5, en eski evrişimli sinir ağları ve gelişimini teşvik etti derin öğrenme. 1988'den beri, yıllarca süren araştırmalardan ve birçok başarılı yinelemeden sonra, öncü çalışmaya LeNet5 adı verildi.

Yann LeCun, 2018'de

1989'da, Yann LeCun et al. -de Bell Laboratuvarları ilk uygulandı geri yayılım algoritması pratik uygulamalara yöneltti ve ağ genellemesini öğrenme yeteneğinin, görevin etki alanından kısıtlamalar sağlayarak büyük ölçüde geliştirilebileceğine inandı. El yazısıyla yazılan sayıları okumak için geri yayılım algoritmaları tarafından eğitilen evrişimli bir sinir ağını birleştirdi ve bunu, ABD Posta Servisi. Bu, daha sonra LeNet olarak adlandırılan şeyin prototipiydi.[1]Aynı yıl, LeCun başka bir makalede el yazısıyla yazılmış küçük bir rakam tanıma problemini tanımladı ve problem doğrusal olarak ayrılabilir olmasına rağmen, tek katmanlı ağların zayıf genelleme yetenekleri sergilediğini gösterdi. Çok katmanlı, kısıtlı bir ağda vardiya-değişmez özellik dedektörlerini kullanırken, model çok iyi performans gösterebilir. Bu sonuçların, sinir ağındaki serbest parametrelerin sayısını en aza indirmenin sinir ağının genelleme yeteneğini geliştirebileceğini kanıtladığına inanıyordu.[2]

1990 yılında, makaleleri, geri yayılım ağlarının el yazısıyla yazılmış rakam tanıma uygulamalarını yeniden tanımladı. Veriler üzerinde yalnızca minimum ön işleme gerçekleştirdiler ve model bu görev için dikkatlice tasarlandı ve oldukça kısıtlıydı. Girdi verileri, her biri bir sayı içeren görüntülerden oluşuyordu ve ABD Posta Hizmetleri tarafından sağlanan posta kodu dijital verilerindeki test sonuçları, modelin yalnızca% 1'lik bir hata oranına ve yaklaşık% 9'luk bir ret oranına sahip olduğunu gösterdi.[3]

Araştırmaları önümüzdeki sekiz yıl boyunca devam etti ve 1998'de Yann LeCun, Leon Bottou, Yoshua Bengio ve Patrick Haffner, kağıtta elle yazılmış karakter tanıma ile ilgili çeşitli yöntemleri gözden geçirdi ve kıyaslama görevlerini belirlemek için standart el yazısı rakamları kullandı. Bu modeller karşılaştırıldı ve sonuçlar, ağın diğer tüm modellerden daha iyi performans gösterdiğini gösterdi. Ayrıca, çevrimiçi olarak el yazısıyla yazılmış karakterleri tanımak için iki sistem ve günde milyonlarca çeki okuyabilen modeller gibi, sinir ağlarının pratik uygulamalarına ilişkin örnekler de sundular.[4]

Araştırma büyük başarı elde etti ve bilim adamlarının sinir ağları çalışmalarına ilgisini uyandırdı. Bugün en iyi performans gösteren sinir ağlarının mimarisi LeNet'in mimarisiyle aynı olmasa da, ağ çok sayıda sinir ağı mimarisi için başlangıç ​​noktasıydı ve aynı zamanda alana ilham kaynağı oldu.

Zaman çizelgesi
1989Yann LeCun ve diğerleri. LeNet'in orijinal biçimini önerdiLeCun, Y .; Boser, B .; Denker, J. S .; Henderson, D .; Howard, R.E .; Hubbard, W. & Jackel, L.D. (1989). El yazısı posta kodu tanımaya geri yayılım uygulandı. Nöral Hesaplama, 1 (4): 541-551.[1]
1989Yann LeCun, sinir ağlarındaki serbest parametrelerin sayısını en aza indirmenin sinir ağlarının genelleme yeteneğini artırabileceğini kanıtlıyor.LeCun, Y. (1989). Genelleme ve ağ tasarımı stratejileri. Teknik Rapor CRG-TR-89-4, Bilgisayar Bilimleri Bölümü, Toronto Üniversitesi.[2]
1990Makaleleri, geri yayılım ağlarının el yazısıyla yazılmış rakam tanıma uygulamasını bir kez daha açıklıyorLeCun, Y .; Boser, B .; Denker, J. S .; Henderson, D .; Howard, R.E .; Hubbard, W. & Jackel, L.D. (1990). Geriye yayılma ağı ile el yazısı rakam tanıma. Sinirsel Bilgi İşleme Sistemlerindeki Gelişmeler 2 (NIPS * 89).[3]
1998El yazısı karakter tanımaya uygulanan çeşitli yöntemleri gözden geçirdiler ve bunları standart el yazısıyla yazılmış rakam tanıma ölçütleriyle karşılaştırdılar. Sonuçlar gösteriyor ki evrişimli sinir ağları diğer tüm modellerden üstün.LeCun, Y .; Bottou, L .; Bengio, Y. ve Haffner, P. (1998). Belge tanımaya uygulanan gradyan tabanlı öğrenme. IEEE'nin süreçleri. 86 (11): 2278 - 2324.[4]

Yapısı[5] [6]

Erken evrişimli sinir ağının bir temsilcisi olarak LeNet, evrişimli sinir ağının gelecekteki gelişimi için bir temel oluşturan, evrişimsel katman, havuz katmanı ve tam bağlantı katmanı gibi temel evrişimsel sinir ağı birimlerine sahiptir. Şekilde gösterildiği gibi (32 * 32 pikselli giriş görüntü verileri): lenet-5 yedi katmandan oluşur. Girişe ek olarak, diğer her katman tren parametreleri. Şekilde, Cx evrişim katmanını, Sx alt örnekleme katmanını, Fx tam bağlantı katmanını ve x katman indeksini temsil etmektedir.[1]

Katman C1 bir evrişim katmanı 5x5'lik altı evrişimli çekirdek ve 28x28 öznitelik eşlemesinin boyutu, giriş görüntüsünün bilgisinin evrişim çekirdeğinin sınırının dışına çıkmasını önleyebilir.

Katman S2, 14x14 boyutunda 6 özellik grafiği çıkaran alt örnekleme / havuzlama katmanıdır. Her özellik haritasındaki her hücre, C1'deki ilgili özellik haritasında 2x2 mahalleye bağlanır.

Katman C3, 16 5-5 evrişim çekirdeğine sahip bir evrişim katmanıdır. İlk altı C3 özellik haritasının girişi, S2'deki üç özellik haritasının her bir sürekli alt kümesidir, sonraki altı özellik haritasının girdisi, dört sürekli alt kümenin girdisinden gelir ve sonraki üç özellik haritasının girdisi, dört süreksiz alt küme. Son olarak, son özellik grafiğinin girdisi, S2'nin tüm özellik grafiklerinden gelir.

Katman S4, 2x2 boyutunda ve 16 5x5 özellik grafiğinin çıktısıyla S2'ye benzer.

Katman C5, 5x5 boyutunda 120 evrişimli çekirdeğe sahip bir evrişim katmanıdır. Her hücre, S4'ün 16 özellik grafiğinin tamamında 5 * 5 mahalleye bağlıdır. Burada S4'ün özellik grafik boyutu da 5x5 olduğu için C5'in çıktı boyutu 1 * 1'dir. Yani S4 ve C5 tamamen bağlantılı. C5, tamamen bağlı bir katman yerine bir evrişimli katman olarak etiketlenir, çünkü eğer lenet-5 girişi daha büyük hale gelirse ve yapısı değişmeden kalırsa, çıktı boyutu 1x1'den büyük olacaktır, yani tam bağlı bir katman olmayacaktır.

F6 katmanı tamamen C5'e bağlıdır ve 84 özellik grafiği çıkarılır.

Özellikleri

  • Her evrişimli katman üç bölümden oluşur: evrişim, havuzlama ve doğrusal olmayan aktivasyon fonksiyonları
  • Uzamsal özellikleri çıkarmak için evrişimi kullanma (Evrişim orijinal olarak alıcı alanlar olarak adlandırılıyordu)
  • Ortalama havuz katmanını alt örnekleme
  • tanh aktivasyon fonksiyonu
  • MLP'yi son sınıflandırıcı olarak kullanma
  • Hesaplamanın karmaşıklığını azaltmak için katmanlar arasında seyrek bağlantı

Uygulama

Basit rakam görüntülerini tanımak, LeNet'in en klasik uygulamasıdır ve bu nedenle ortaya atılmıştır.

Ne zaman Yann LeCun, et al LeNet'in ilk biçimini 1989'da ortaya attı. El Yazısıyla Yazılmış Posta Kodu Tanıma için Uygulanan Geri Yayınlama[1] bu tür kısıtlamaların bir geri yayılım ağ mimarisi aracılığıyla ağ. Ve ABD Posta Hizmetleri tarafından sağlanan elle yazılmış posta kodu rakamlarının tanınmasına başarıyla uygulanmıştır.[1]

Geliştirme analizi

LeNet5, CNN ve temel bileşenlerini tanımlar CNN.[4] Ancak o zamanlar donanım ekipmanı eksikliği nedeniyle, özellikle GPU (Grafik İşlem Birimi, özel bir elektronik devre hızla manipüle etmek ve değiştirmek için tasarlanmış hafıza yaratılmasını hızlandırmak için Görüntüler içinde çerçeve arabelleği bir görüntü cihazı ) ve diğer algoritmalar, örneğin SVM benzer etkiler elde edebilir ve hatta LeNet'i aşabilir.

AlexNet'in 2012'deki başarısına kadar, CNN bilgisayarla görme uygulamaları için en iyi seçenek haline geldi ve birçok farklı CNN R- gibi yükseltildiCNN dizi. Şu günlerde, CNN modeller Lenet'ten oldukça farklıdır, ancak hepsi LeNet temelinde geliştirilmiştir.

Referanslar

  1. ^ a b c d e LeCun, Y .; Boser, B .; Denker, J. S .; Henderson, D .; Howard, R.E .; Hubbard, W .; Jackel, L. D. (Aralık 1989). "El Yazısıyla Yazılmış Posta Kodu Tanıma Uygulamasına Geri Yayınlama". Sinirsel Hesaplama. 1 (4): 541–551. doi:10.1162 / neco.1989.1.4.541. ISSN  0899-7667.
  2. ^ a b Lecun, Yann (Haziran 1989). "Genelleme ve ağ tasarımı stratejileri" (PDF). Teknik Rapor CRG-TR-89-4. Bilgisayar Bilimleri Bölümü, Toronto Üniversitesi.
  3. ^ a b LeCun, Y .; Boser, B .; Denker, J. S .; Henderson, D .; Howard, R.E .; Hubbard, W .; Jacker, L.D. (Haziran 1990). "Geri yayılma ağı ile el yazısı rakam tanıma" (PDF). Sinirsel Bilgi İşleme Sistemlerindeki Gelişmeler 2: 396–404.
  4. ^ a b c Lecun, Y .; Bottou, L .; Bengio, Y .; Haffner, P. (1998). "Belge tanımaya uygulanan gradyan tabanlı öğrenme" (PDF). IEEE'nin tutanakları. 86 (11): 2278–2324. doi:10.1109/5.726791.
  5. ^ "卷积 神经 网络 之 LeNet - Brook_icv - 博客 园". www.cnblogs.com (Çin'de). Alındı 2019-11-16.
  6. ^ blog.csdn.net https://blog.csdn.net/happyorg/article/details/78274066. Alındı 2019-11-16. Eksik veya boş | title = (Yardım)