Genelleştirilmiş Hough dönüşümü - Generalised Hough transform

genelleştirilmiş Hough dönüşümü (GHT), tarafından tanıtıldı Dana H. Ballard 1981'de, Hough dönüşümü prensibini kullanarak şablon eşleme.[1] Hough dönüşümü başlangıçta analitik olarak tanımlanmış şekilleri (ör. hat, daire, elips vb.). Bu durumlarda, şekil hakkında bilgi sahibiyiz ve resmin içindeki yerini ve yönünü bulmayı hedefliyoruz. Bu modifikasyon, Hough dönüşümünün, modeli ile tanımlanan rastgele bir nesneyi tespit etmek için kullanılmasını sağlar.

Bir görüntüdeki nesneyi (bir modelle açıklanan) bulma sorunu, modelin görüntüdeki konumunu bularak çözülebilir. Genelleştirilmiş Hough dönüşümü ile, modelin konumunu bulma sorunu, modeli görüntüye eşleyen dönüşümün parametresini bulma sorununa dönüştürülür. Dönüşüm parametresinin değeri göz önüne alındığında, modelin görüntüdeki konumu belirlenebilir.

GHT'nin orijinal uygulaması, bir kenar noktasının oryantasyonundan şeklin referans noktasına kadar bir eşlemeyi tanımlamak için kenar bilgilerini kullandı. Bir durumunda ikili görüntü Piksellerin siyah veya beyaz olabileceği yerlerde, görüntünün her siyah pikseli istenen desenin siyah pikseli olabilir ve böylece bir mahal Hough uzayında referans noktaları. Görüntünün her pikseli, karşılık gelen referans noktaları için oy kullanır. Hough alanının maksimum noktaları, görüntüdeki modelin olası referans noktalarını gösterir. Bu maksimum, Hough alanını tarayarak veya bir rahat denklem seti, her biri siyah bir piksele karşılık gelir.[2]

Tarih

Merlin ve Farber[3] istenen eğriler analitik olarak tanımlanamadığında bir Hough algoritmasının nasıl kullanılacağını gösterdi. Ballard'ın algoritmasının habercisiydi. tercüme ve hesaba katmadı rotasyon ve ölçek değişiklikler.[4]

Merlin-Farber algoritması, birçok kenar pikselli bir görüntüde olduğu gibi gerçek görüntü verileri için kullanışsızdır, tekrarlayan piksel düzenlemeleri nedeniyle birçok yanlış pozitif bulur.

Genelleştirilmiş Hough dönüşümü teorisi

Hough algoritmasını analitik olmayan eğrilere genelleştirmek için Ballard, genelleştirilmiş bir şekil için aşağıdaki parametreleri tanımlar: a = {y, s, θ} nerede y referans Menşei şekil için θ oryantasyonu ve s = (sx, sy) ikiyi tanımlar dikey ölçek faktörleri. Bir algoritma, belirli bir şekil için kenar piksel verilerinden en iyi parametre setini hesaplayabilir. Bu parametreler eşit statüye sahip değildir. Referans menşe yeri, y, olası kenar piksel oryantasyonlarının R tablosu olarak adlandırılan bir şablon tablosu açısından açıklanmaktadır. Ek parametrelerin hesaplanması s ve θ daha sonra bu tabloya doğrudan dönüşümlerle gerçekleştirilir. Rasgele şekillere temel genelleme, yön bilgisinin kullanılmasıdır. Herhangi bir şekil ve üzerinde sabit bir referans noktası verildiğinde, parametrik bir eğri yerine, sınır pikselleri tarafından sağlanan bilgi, dönüştürme aşamasında R-tablosu biçiminde saklanır. Test görüntüsündeki her kenar noktası için, noktanın özellikleri R-tablosunda aranır ve referans noktası alınır ve Akümülatör matrisi adı verilen bir matristeki uygun hücre artırılır. Biriktirici matrisindeki maksimum 'oy'lu hücre, test görüntüsündeki nesnenin sabit referansının olası bir varoluş noktası olabilir.

R-tablosunun oluşturulması

Bir referans noktası seçin y şekil için (tipik olarak şeklin içinde seçilir). Her sınır noktası için x, hesaplamak ɸ (x), gradyan yön ve r = y - x resimde gösterildiği gibi. Mağaza r bir fonksiyonu olarak ɸ. Her dizininin ɸ birçok değeri olabilir r. Sabit referans ve kenar noktası arasındaki koordinat farkları saklanabilir ((xc - xij), (yc - yij)) veya radyal mesafe ve aralarındaki açı olarak (rij , αij) . Bunu her nokta için yaptıktan sonra, R-tablosu şablon nesnesini tam olarak temsil edecektir. Ayrıca, üretim aşaması tersine çevrilebilir olduğundan, bunu görüntünün diğer yerlerindeki nesne oluşumlarını lokalize etmek için kullanabiliriz.

Genelleştirilmiş Hough dönüşümü için şekil algılama geometrisi
benɸbenRɸben
10(r11, α11) (r12, α12)… (R1n, α1n)
2Δɸ(r21, α21) (r22, α22)… (R2a, α2a)
32Δɸ(r31, α31) (r32, α32)… (R3k, α3k)
.........

Nesne yerelleştirme

Her kenar pikseli için x görüntüdeki gradyanı bulun ɸ ve ilgili tüm noktaları artırın x + r akümülatör dizisinde Bir (görüntünün maksimum boyutuna başlatılmıştır) burada r, tarafından indekslenen bir tablo girdisidir ɸyani r (ɸ). Bu giriş noktaları bize referans noktası için olası her konumu verir. Nesnenin görüntüde mevcut olduğu göz önüne alındığında bazı sahte noktalar hesaplanabilse de, referans noktasında bir maksimum meydana gelecektir. Maxima içinde Bir şeklin olası örneklerine karşılık gelir.

Ölçek ve oryantasyonun genelleştirilmesi

Sabit bir şekil yönelimi için, toplayıcı dizisi referans noktası koordinatlarında iki boyutludur. Keyfi yönelim şekillerini aramak için θ ve ölçeklendir s, bu iki parametre şekil açıklamasına eklenir. Toplayıcı dizisi artık parametrelere karşılık gelen dört boyuttan oluşur (y, s, θ). Farklı yönelim ve ölçekler tablonun kolayca hesaplanan dönüşümlerine karşılık geldiğinden, R-tablosu bu daha büyük boyutlu alanı arttırmak için de kullanılabilir. Bir şekil için belirli bir R-tablosunu belirtin S tarafından R (ɸ). Bu tabloya yapılan basit dönüştürmeler, aynı şeklin ölçeklenmiş veya döndürülmüş örneklerini algılamasına olanak tanır. Örneğin, şekil s ile ölçeklenirse ve bu dönüşüm ile ifade edilirse Ts.sonraTs[R (ɸ)] = sR (ɸ) yani, tüm vektörler ölçeklenir s. Ayrıca, nesne şu şekilde döndürülürse θ ve bu dönüşüm ile ifade edilir Tθ, sonraTθ[R (ɸ)] = Dön {R [(ɸ-θ) mod2π], θ}yani, tüm endeksler - θ modulo 2π, uygun vektörler r bulunur ve sonra döndürülürler θGenelleştirilmiş Hough dönüşümlerinin bileşimini tanımlamada faydalı olacak bir diğer özellik, referans noktasının değişmesidir. Yeni bir referans noktası seçmek istiyorsak öyle ki y-ỹ = z daha sonra R tablosundaki değişiklik şu şekilde verilir: R (ɸ) + zyani z tablodaki her vektöre eklenir.

Kenar çiftlerini kullanmanın alternatif yolu

Parametre boşluğunu azaltmak için bir çift kenar piksel kullanılabilir. R-tablosunu ve yukarıda açıklanan özellikleri kullanarak, her bir kenar pikseli, dört boyutlu biriktirici uzayda bir yüzeyi tanımlar. a = (y, s, θ). Farklı yönlerdeki iki kenar pikseli, aynı yüzeyi, aynı miktarda döndürülmüş olarak tanımlar. θ. Bu iki yüzey kesişirse, kesiştikleri noktalar olası parametrelere karşılık gelir. a şekil için. Böylece teorik olarak görüntü uzayındaki iki noktayı parametre uzayındaki lokusu tek bir noktaya indirmek için kullanmak mümkündür. Bununla birlikte, parametre uzayında iki yüzeyin kesişim noktalarını bulmanın zorlukları, bu yaklaşımı çoğu durumda olanaksız hale getirecektir.

Bileşik şekiller

S şekli alt parçalardan oluşan kompozit bir yapıya sahipse S1, S2, .. SN ve şekiller için referans noktaları S, S1, S2, .. SN vardır y, y1, y2, .. ynsırasıyla, ardından bir ölçekleme faktörü için s ve yönelim θ, genelleştirilmiş Hough dönüşümü Rs(ɸ) tarafından verilir . Bu dönüşümle ilgili endişe, referans seçiminin doğruluğu büyük ölçüde etkileyebilmesidir. Bunun üstesinden gelmek için Ballard, elde edilen akümülatörü kompozit bir düzleştirme şablonu ile düzleştirmeyi önerdi. Bileşik yumuşatma şablonu H (y) kompozit olarak verilir kıvrım alt şekillerin bireysel yumuşatma şablonlarının. . Daha sonra geliştirilmiş Akümülatör tarafından verilir Birs = A * H ve maksimum Birs şeklin olası örneklerine karşılık gelir.

Uzaysal ayrışma

Küresel Hough dönüşümünün, ayrık alt bölgenin yerel Hough dönüşümlerinin toplanmasıyla elde edilebileceğini gözlemleyerek, Heather ve Yang[5] aşağıdakileri içeren bir yöntem önerdi: yinelemeli alt bölüm görüntünün, her biri kendi parametre uzayına sahip olan ve bir dörtlü ağaç yapı. Hat segmentlerinin uç noktalarını bulmada artırılmış verimlilik ve gürültülü durumlarda hatların çıkarılmasında, biraz artırılmış bellek maliyetiyle gelişmiş sağlamlık ve güvenilirlik sağlar.

Uygulama

Uygulama aşağıdaki denklemleri kullanır:[6]

Yukarıdaki denklemleri birleştirirsek:

R-tablasının oluşturulması

(0) Örnek şekil görüntüsünü herhangi birini kullanarak bir kenar görüntüsüne dönüştürün. kenar algılama algoritma gibi Canny kenar dedektörü
(1) Bir referans noktası seçin (ör. (xc, yc))
(2) Referans noktasından sınıra bir çizgi çizin
(3) Hesaplama ɸ
(4) Referans noktasını kaydedin (xc, yc) bir fonksiyonu olarak ɸ içinde R (ɸ) tablo.

Tespit etme:

(0) Örnek şekil görüntüsünü herhangi bir kenar algılama algoritması kullanarak bir kenar görüntüsüne dönüştürün. Canny kenar dedektörü.
(1) Akümülatör tablosunu başlatın: A [xcmin. . . xcmax] [ycmin. . . ycmax]
(2) Her kenar noktası için (x, y)
(2.1) Gradyan açısının kullanılması ɸ, R-tablosundan tüm (α, r) altında indekslenen değerler ɸ.
(2.2) Her biri için (α, r), aday referans noktalarını hesaplayın:
xc = x + r cos (α)
yc = y + r günah (α)
(2.3) Sayaçları artırın (oylama):
++ A ([[xc]] [yc])
(3) Nesne konturunun olası konumları, yerel maksimumlar ile verilmiştir. A [xc] [yc].
Eğer A [xc] [yc]> T, sonra nesne çevresi şu konumda bulunur: (xc, yc)

Genel dava:

Nesnenin bir miktar rotasyona uğradığını varsayalım ϴ ve tek tip ölçeklendirme s:

(x ’, y’) -> (x ’’, y ’’)
x "= (x’cos (ϴ) - y’sin (ϴ)) s
y "= (x’sin (ϴ) + y’cos (ϴ)) s
X’i x "ile ve y’yi y" ile değiştirmek:
xc = x - x "veya xc = x - (x’cos (ϴ) - y’sin (ϴ)) s
yc = y - y "veya yc = y - (x’sin (ϴ) + y’cos (ϴ)) s
(1) Akümülatör tablosunu başlatın: A [xcmin. . . xcmax] [ycmin. . . ycmax] [qmin . . .qmax] [smin . . . smax]
(2) Her kenar noktası için (x, y)
(2.1) Gradyan açısını kullanarak ɸ, hepsini al (α, r) R tablosundaki değerler
(2.2) Her biri için (α, r), aday referans noktalarını hesaplayın:
x '= r cos (α)
y ’= r günah (α)
için(ϴ = ϴmin; ϴ ≤ ϴmax; ϴ ++)
için(s = smin; s ≤ smax; s ++)
xc = x - (x’cos (ϴ) - y’sin (ϴ)) s
yc = y - (x’sin (ϴ) + y’cos (ϴ)) s
++ (A [xc] [yc] [ϴ] [s])
(3) Nesne konturunun olası konumları, yerel maksimumlar ile verilmiştir. A [xc] [yc] [ϴ] [s]
Eğer A [xc] [yc] [ϴ] [s]> T, sonra nesne çevresi şu konumda bulunur: (xc, yc)bir rotasyon geçirdi ϴve ölçeklendirildi s.

Avantajlar ve dezavantajlar

Avantajlar

  • Kısmi veya hafif deforme olmuş şekillere karşı sağlamdır (yani, tıkanma altında tanınmaya dayanıklıdır).
  • Görüntüdeki ek yapıların varlığına karşı sağlamdır.
  • Gürültüye toleranslıdır.
  • Aynı işlem geçişi sırasında bir şeklin birden fazla oluşumunu bulabilir.

Dezavantajları

  • Nesne yönelimi ve ölçeğinin dikkate alınması gerektiğinde akut hale gelen önemli hesaplama ve depolama gereksinimleri vardır.

Alakalı iş

Ballard, hesaplama maliyetini düşüren kenarın yönlendirme bilgisinin kullanılmasını önerdi. SC-GHT (Eğim ve eğriliği yerel özellikler olarak kullanma) gibi birçok verimli GHT tekniği önerilmiştir.[7]Davis ve Yam[8] ayrıca Merlin'in Ballard'ın çalışmasını tamamlayan, ancak Ballard'ın kenar-eğim bilgilerini ve kompozit yapıları kullanımını içermeyen oryantasyon ve ölçek değişmez eşleştirme çalışmalarının bir uzantısını önerdi.

Ayrıca bakınız

Referanslar

  1. ^ D.H. Ballard, "Rasgele Şekilleri Algılamak için Hough Dönüşümünü Genelleştirme", Örüntü Tanıma, Cilt 13, No. 2, s. 111-122, 1981
  2. ^ Jaulin, L .; Bazeille, S. (2013). Aralık Yöntemlerini Kullanarak Görüntü Şekli Ayıklama (PDF). Sysid Bildirileri 2009, Saint-Malo, Fransa.
  3. ^ Merlin, P. M .; Farber, D.J. (Ocak 1975). "Resimlerdeki Eğrileri Algılamak İçin Paralel Bir Mekanizma". Bilgisayarlarda IEEE İşlemleri. C-24 (1): 96–98. doi:10.1109 / t-c.1975.224087. ISSN  0018-9340.
  4. ^ L. Davis, "Hiyerarşik Genelleştirilmiş Hough Dönüşümleri ve Çizgi Segmentine Dayalı Genelleştirilmiş Hough Dönüşümleri", University of Texas Computer Sciences, Kasım 1980
  5. ^ J.A. Heather, Xue Dong Yang, "Hough Dönüşümünün Uzamsal Ayrıştırılması", 2. Kanada Bilgisayar ve Robot Görü Konferansı, 2005.
  6. ^ Ballard ve Brown, bölüm 4.3.4, Sonka ve diğerleri, bölüm 5.2.6
  7. ^ A. A. Kassim, T. Tan, K. H. Tan, "Verimli genelleştirilmiş Hough dönüşüm tekniklerinin karşılaştırmalı bir çalışması", Görüntü ve Görme Hesaplama, Cilt 17, Sayı 10, Sayfa 737-748, Ağustos 1999
  8. ^ L. Davis ve S. Yam, "Şekil tanıma için genelleştirilmiş kabuklu benzeri bir dönüşüm". University of Texas Computer Sciences, TR-134, Şubat 1980.

Dış bağlantılar