Yüz halüsinasyonu - Face hallucination

Yüz halüsinasyonu herhangi birini ifade eder süper çözünürlük özellikle yüzler için geçerli olan teknik. Gürültülü veya düşük çözünürlüklü yüz görüntülerini alan ve bunları tipik yüz özellikleri hakkındaki bilgileri kullanarak yüksek çözünürlüklü görüntülere dönüştüren teknikleri içerir. Uygulanabilir yüz tanıma sistemleri Yüzleri daha hızlı ve daha etkili bir şekilde tanımak için Yüz tanıma sistemlerindeki olası uygulamalar nedeniyle yüz halüsinasyonu aktif bir araştırma alanı haline geldi.

Yüz halüsinasyonu ve süper çözünürlük arasındaki farklar

Resim süper çözünürlük bir dizi düşük çözünürlüklü görüntü kullanarak bir görüntünün çözünürlüğünü artıran bir teknikler sınıfıdır. Her iki teknik arasındaki temel fark, yüz halüsinasyonunun yüz görüntüleri için süper çözünürlük olması ve her zaman yüz etki alanı kavramına güçlü bir uyum ile tipik yüz önceleri kullanmasıdır.

Ölçümler

Bir görüntü 128x96 piksel ölçtüğünde yüksek çözünürlüklü olarak kabul edilir.[kaynak belirtilmeli ] Bu nedenle, yüz halüsinasyonunun amacı, giriş görüntüsünün bu piksel sayısına ulaşmasını sağlamaktır. Giriş görüntüsünün en yaygın değerleri genellikle 32x24 piksel veya 16x12 pikseldir.[kaynak belirtilmeli ]

Dahası, yüz halüsinasyonundaki zorluk, yüzleri hizalamanın zorluğudur. Alınan test numunesi ile eğitim numuneleri arasındaki uyumu sağlamak için birçok yöntem gereklidir. Az miktarda yanlış hizalama bile yöntemi ve sonucu bozabilir.

Algoritma

Son yirmi yılda, birçok özel yüz halüsinasyon algoritmasının bu tekniği uyguladığı bildirildi. Mevcut yüz halüsinasyon yöntemleri büyük başarı elde etmesine rağmen, hala iyileştirme için çok yer var.

Ortak algoritmalar genellikle iki adımı gerçekleştirir: ilk adım, olasılık yöntemini kullanarak yüzün özelliklerini tutan küresel yüz görüntüsü oluşturur. maksimum a posteriori (HARİTA). İkinci adım, birinci adımın sonucunu telafi etmek için artık görüntü üretir. Ayrıca, tüm algoritmalar, görüntü süper çözünürlük tekniklerini yüz görüntüsü sentezine dahil eden bir dizi yüksek ve düşük çözünürlüklü eğitim görüntü çiftine dayanmaktadır.

Herhangi bir yüz halüsinasyon algoritması üç kısıtlamaya dayanmalıdır:

Veri kısıtlaması

Çıktı görüntüsü, düzleştirildiğinde veya aşağı örneklendiğinde orijinal görüntüye yakın olmalıdır.

Global kısıtlama

Ortaya çıkan görüntü her zaman bir insan yüzünün tüm ortak özelliklerini içerir. Yüz özellikleri her zaman uyumlu olmalıdır. Bu kısıtlama olmadan çıktı çok gürültülü olabilir.

Yerel kısıtlama

Çıktı görüntüsü, fotogerçekçi yerel özelliklerle benzerlik gösteren yüz görüntüsünün çok spesifik özelliklerine sahip olmalıdır. Bu kısıtlama olmaksızın, ortaya çıkan görüntü çok düzgün olabilir.

Yöntemler

Yüz halüsinasyonu, farklı yöntemler kullanarak yüz özelliklerini iyileştirilmiş görüntü çözünürlüğünü geliştirir.

Görüntü çözünürlüğünü artırmanın en basit yolu, en yakın komşu, çift doğrusal ve kübik spline enterpolasyon varyantları gibi algoritmalarla girdi görüntülerinin piksel yoğunluklarını artıran doğrudan bir enterpolasyondur. Bir başka enterpolasyon yaklaşımı, bir dizi yüksek çözünürlüklü eğitim örneğinden, bunların karşılık gelen düşük çözünürlüklü versiyonlarıyla birlikte nasıl enterpolasyon yapılacağını öğrenmektir. (pg 4 fırıncı ve kanade)

Ancak, sürece yeni bilgi eklenmediği için sonuçlar çok zayıftır. Bu nedenle son yıllarda yeni yöntemler önerilmiştir.

Bayes teoremine dayalı yüz halüsinasyonu

Bu yöntem Baker ve Kanade tarafından önerildi,[1] yüz halüsinasyon tekniğinin öncüsü.

Algoritma, Bayesian MAP formülasyonuna dayanır ve amaç işlevini optimize etmek için gradyan inişini kullanır ve eğitim örnekleri yardımıyla bir ana yapıdan yüksek frekanslı ayrıntıları üretir.

Öğrenilmiş görüntü modellerini kullanarak birden çok görünümden süper çözünürlük

Capel ve Zisserman [2] yerel yüz görüntüsü SR yöntemini öneren ilk kişiydi.

Yüz görüntüsünü dört ana bölgeye ayırdı: gözler, burun, ağız ve yanak alanları. Her alan için ayrı bir Temel bileşenler Analizi (PCA) alanı ayrı ayrı temel alır ve yeniden yapılandırır. Bununla birlikte, bu yöntemde yeniden oluşturulmuş yüz görüntülerinin farklı bölgeler arasında görünür kusurları vardır.

Seyrek Kodlama ile Yüz Halüsinasyonu

Bu yöntem, J. Yang ve H. Tang tarafından önerilmiştir.[3] ve Düşük Çözünürlüklü giriş değeri alarak Yüksek Çözünürlüklü yüz görüntüsünün halüsinasyonuna dayanır. Yöntem, Negatif Olmayan Matris çarpanlarına ayırma kullanarak yüz özelliklerinden yararlanır (NMF ) yerelleştirilmiş parça tabanlı alt uzay öğrenmek için yaklaşım. Bu alt uzay, gelen yüzün süper çözümlenmesi için etkilidir.

Seyrek gösterime dayalı yerel bir yama yöntemi kullanarak ayrıntılı yüz yapısını daha da geliştirmek için.

Eigentransformation ile Yüz Halüsinasyonu

Yüz görüntülerinin özyüzleri

Bu yöntem Wang ve Tang tarafından önerildi [4] ve bir eigentransformasyon. Bu yöntem, çözümü farklı görüntü stilleri arasında bir dönüşüm olarak görür ve düşük çözünürlüklü yüz görüntüsüne uygulanan bir temel bileşen analizi (PCA) kullanır. "Özyüz" sayısını seçerek, düşük çözünürlüklü yüz görüntüsü bilgisinin miktarını çıkarabilir ve gürültüyü kaldırabiliriz.

Öz dönüşüm algoritmasında, halüsinasyonlu yüz görüntüsü, yüksek çözünürlüklü eğitim görüntülerinin doğrusal kombinasyonu ile sentezlenir ve kombinasyon katsayıları, temel bileşen analizi yöntemi kullanılarak düşük çözünürlüklü yüz görüntülerinden gelir. Algoritma, iki parça arasındaki korelasyondan yararlanarak düşük frekanslı yüz bilgilerinden bazı yüksek frekanslı yüz ayrıntılarını çıkararak görüntü çözünürlüğünü iyileştirir. Yüz görüntüleri arasındaki yapısal benzerlik nedeniyle, çok çözünürlüklü analizde, yüksek frekans bandı ile düşük frekans bandı arasında güçlü bir korelasyon vardır. Yüksek çözünürlüklü yüz görüntüleri için, PCA bu ilişkili bilgileri az sayıda ana bileşen üzerine sıkıştırabilir. Daha sonra, öz dönüşüm sürecinde, bu temel bileşenler, yüksek ve düşük çözünürlüklü eğitim çiftleri arasında eşleştirilerek düşük çözünürlüklü yüzün ana bileşenlerinden çıkarılabilir.

İki adımlı yaklaşım

Bu yöntem C. Liu ve Shum tarafından geliştirilmiştir. [5][6] ve bir global parametrik ve bir yerel parametrik modeli entegre eder. Global model, doğrusal bir parametrik çıkarımdır ve yerel model, yama tabanlı parametrik olmayan bir Markov ağıdır.

İlk adımda, yüksek çözünürlüklü görüntü ile düzleştirilmiş ve aşağı örneklenmiş arasındaki ilişkiyi öğrenin. İkinci adımda, yüzlerin yüksek frekanslı içeriğini yakalamak için parametrik olmayan bir Markov ağı tarafından öğrenilmiş doğrusal modeli uyguladıktan sonra orijinal bir yüksek çözünürlük ile yeniden oluşturulmuş yüksek çözünürlüklü görüntü arasındaki artığı modelleyin.

MCA'ya dayalı yüz halüsinasyonu

Bu algoritma, yüz halüsinasyonunu bir görüntü ayrıştırma problemi olarak formüle eder ve bir Morfolojik Bileşen Analizi (MCA)) önerir]][7] tabanlı yöntem.

Yöntem, üç adımlı bir çerçevede sunulur. İlk olarak, düşük çözünürlüklü bir girdi görüntüsü, bir enterpolasyon ile yukarı örneklenir. Enterpolasyonlu görüntü, küresel yüksek çözünürlüklü görüntünün üst üste binmesi ve bir "keskin olmayan maske" olarak temsil edilebilir. İkinci adımda, interpolasyonlu görüntüden HR görüntüsünün global yaklaşımını elde etmek için MCA kullanılarak enterpolasyonlu görüntü global bir yüksek çözünürlüklü görüntüye ayrıştırılır. Son olarak, yüz detayı bilgisi, konum yamalarının komşu rekonstrüksiyonu kullanılarak tahmini HT görüntüsüne telafi edilir.

Başka yöntemler

  • Tensör yama süper çözünürlüğü ve bağlı kalıntı telafisi ile yüz halüsinasyonu.
  • Süper çözünürlük seyrek temsil video gözetimi için.
  • Pozisyon yama ile halüsinasyon yüz.
  • Konuma dayalı.
  • Kalıntı telafisi için LPH süper çözünürlüğü ve komşu yeniden yapılandırması.

Sonuçlar

Yukarıda sunulan tüm yöntemlerin çok tatmin edici sonuçları vardır ve beklentileri karşılar, bu nedenle hangi yöntemin en etkili ve hangisinin daha iyi sonuç verdiğini belirlemek zordur.

Ancak şu ifade edilebilir:

  • Baker ve Kanade'nin yöntemi, bir yüz görüntüsünün karakteristik özelliklerini bozabilir.
  • Wang ve Tang tarafından geliştirilen yöntemin sonucu çınlama etkisi yaratabilir.

Referanslar

  1. ^ Baker, Simon; Kanade, Takeo. "Halüsinasyon Yüzleri". Alındı 18 Kasım 2014. Alıntı dergisi gerektirir | günlük = (Yardım)
  2. ^ Capel, D .; Zisserman, A. (2001). "Öğrenilmiş görüntü modellerini kullanarak birden çok görünümden süper çözünürlük" (PDF). Öğrenilmiş görüntü modellerini kullanarak birden çok görünümden Süper Çözünürlük. 2. Kauai, Hawaii. pp.627–634. doi:10.1109 / CVPR.2001.991022. ISBN  978-0-7695-1272-3. Alındı 4 Mart 2015.
  3. ^ Yang, Jianchao; Tang, Hao; İzin verirseniz; Huang, Thomas. "Seyrek Kodlama Yoluyla Yüz Halüsinasyonu" (PDF). Alındı 4 Mart 2015. Alıntı dergisi gerektirir | günlük = (Yardım)
  4. ^ Xiaogang Wang ve Xiaoou Tang "Eigentransformation ile Halüsinasyon Yüzü" (PDF). 2005. Alındı 17 Kasım 2014.
  5. ^ C. Liu, H.Y. Shum ve W.T Freeman "Yüz Halüsinasyonu: Teori ve Uygulama". Ekim 2007. Alındı 20 Kasım 2014.
  6. ^ C. Liu, H.Y. Shum ve W.T Freeman "Yüz Halüsinasyonu: Teori ve Uygulama" (PDF). Ekim 2007. Alındı 20 Kasım 2014.
  7. ^ Yan Liang, Xiaohua Xie, Jian-Huang Lai "Morfolojik Bileşen Analizine Dayalı Yüz Halüsinasyonu" (PDF). Ekim 2012. Arşivlenen orijinal (PDF) 5 Aralık 2014. Alındı 21 Kasım 2014.

Kaynakça

Dış bağlantılar