Kanade – Lucas – Tomasi özellik izleyicisi - Kanade–Lucas–Tomasi feature tracker

İçinde Bilgisayar görüşü, Kanade – Lucas – Tomasi (KLT) özellik izleyicisi bir yaklaşımdır özellik çıkarma. Esas olarak, geleneksel olan problemi ele almak amacıyla önerilmiştir. Görüntü kaydı teknikler genellikle maliyetlidir. KLT, en iyi eşleşmeyi sağlayan konumu aramayı yönlendirmek için uzamsal yoğunluk bilgisini kullanır. Görüntüler arasında çok daha az potansiyel eşleşmeyi incelemek için geleneksel tekniklerden daha hızlıdır.

Kayıt sorunu

Geleneksel görüntü kayıt problemi şu şekilde karakterize edilebilir: İki işlev verildiğinde ${ displaystyle F (x)}$ ve ${ displaystyle G (x)}$ , her konumdaki değerleri temsil eder ${ displaystyle x}$ , nerede ${ displaystyle x}$ sırasıyla iki görüntüde bir vektördür, eşitsizlik vektörünü bulmak istiyoruz ${ displaystyle h}$ bu, arasındaki farkın bir ölçüsünü en aza indirir ${ displaystyle F (x + h)}$ ve ${ displaystyle G (x)}$ , için ${ displaystyle x}$ bazı ilgi bölgelerinde ${ displaystyle R}$ .

Arasındaki farkın bazı ölçüleri ${ displaystyle F (x + h)}$ ve ${ displaystyle G (x)}$ :

L₁ norm = ${ displaystyle toplamı _ {x in R} sol vert F (x + h) -G (x) sağ vert}$
L₂ norm = ${ displaystyle { sqrt { toplamı _ {x in R} sol [F (x + h) -G (x) sağ] ^ {2}}}}$
Normalleştirilmiş korelasyonun negatifi
= ${ displaystyle { dfrac {- toplamı _ {x in R} F (x + h) G (x)} {{ sqrt { toplamı _ {x R} F (x + h) ^ { 2}}} { sqrt { toplam _ {x in R} G (x) ^ {2}}}}}}$

Kayıt algoritmasının temel açıklaması

KLT özellik izleyicisi iki belgeye dayanmaktadır:

İlk makalede Lucas ve Kanade^[1] görüntünün ikinci türevine bir yaklaşımla ağırlıklandırılan gradyanları kullanarak yerel bir arama fikrini geliştirdi.

Tek boyutlu durum

Eğer ${ displaystyle h}$ iki görüntü arasındaki yer değiştirmedir ${ displaystyle F (x)}$ ve ${ displaystyle G (x) = F (x + h)}$ daha sonra tahmin yapılır ki

{ displaystyle F '(x) yaklaşık { dfrac {F (x + h) -F (x)} {h}} = { dfrac {G (x) -F (x)} {h}} ,}

Böylece

{ displaystyle h yaklaşık { dfrac {G (x) -F (x)} {F '(x)}} ,}

Görüntünün gradyanına olan bu yaklaşım, yalnızca kaydedilecek iki görüntü arasındaki yerel alanın yer değiştirmesi çok büyük değilse doğrudur. Yaklaşım ${ displaystyle h}$ bağlıdır ${ displaystyle x}$ . Çeşitli tahminleri birleştirmek için ${ displaystyle h}$ çeşitli değerlerde ${ displaystyle x}$ , bunların ortalamasını almak doğaldır:

{ displaystyle h yaklaşık { dfrac { sum _ {x} { dfrac {G (x) -F (x)} {F '(x)}}} { sum _ {x} 1}}. }

Ortalama, her terimin katkısının ağırlıklandırılmasıyla daha da iyileştirilebilir; bu, bir tahminle ters orantılıdır. ${ displaystyle sol vert F '' (x) sağ vert}$ , nerede

{ displaystyle F '' (x) yaklaşık { dfrac {G '(x) -F' (x)} {h}}.}

İfadeyi kolaylaştırmak amacıyla, bir ağırlıklandırma işlevi tanımlanmış:

{ displaystyle w (x) = { dfrac {1} { sol vert G '(x) -F' (x) sağ vert}}.}

Ağırlıklandırmalı ortalama şu şekildedir:

{ displaystyle h = { dfrac { toplamı _ {x} { dfrac {w (x) sol [G (x) -F (x) sağ]} {F '(x)}}} { toplam _ {x} w (x)}}.}

Tahmin edildikten sonra ${ displaystyle F (x)}$ tahmini ile taşınabilir ${ displaystyle h}$ . Prosedür tekrar tekrar uygulanır ve bir tür Newton-Raphson yineleme. Tahmin dizisi ideal olarak en iyiye yakınlaşacaktır. ${ displaystyle h}$ . Yineleme şu şekilde ifade edilebilir:
${ displaystyle { begin {case} h_ {0} = 0 h_ {k + 1} = h_ {k} + { dfrac { sum _ {x} { dfrac {w (x) left [ G (x) -F (x + h_ {k}) right]} {F '(x + h_ {k})}}} { sum _ {x} w (x)}} end {case} }}$

Alternatif bir türetme

Yukarıdaki türetme, 2-B için iki boyuta iyi genelleştirilemez. Doğrusal yaklaşım farklı şekilde gerçekleşir. Bu, aşağıdaki biçimde doğrusal yaklaşım uygulanarak düzeltilebilir:

{ displaystyle F (x + h) yaklaşık F (x) + hF '(x),}

bulmak için ${ displaystyle h}$ L'yi en aza indiren₂ Hatanın şu şekilde ifade edilebildiği eğriler arasındaki farkın (veya hatanın) norm ölçüsü:

{ displaystyle E = toplam _ {x} sol [F (x + h) -G (x) sağ] ^ {2}.}

Hatayı en aza indirmek için ${ displaystyle h}$ kısmen farklılaştırmak ${ displaystyle E}$ ve sıfıra ayarlayın:

{ displaystyle { begin {align} 0 & = { dfrac { kısmi E} { kısmi h}} & yaklaşık { dfrac { kısmi} { kısmi h}} toplamı _ {x} sol [F (x) + hF '(x) -G (x) sağ] ^ {2} & = toplam _ {x} 2F' (x) sol [F (x) + hF '( x) -G (x) sağ] end {hizalı}}}

,

{ displaystyle Rightarrow h yaklaşık { dfrac { toplamı _ {x} F '(x) [G (x) -F (x)]} { toplamı _ {x} F' (x) ^ {2 }}} ,}

Bu, temelde 1-D durumuyla aynıdır, ancak ağırlıklandırma işlevi ${ displaystyle w (x) = F '(x) ^ {2}.}$ Ve ağırlıklı yineleme formu şu şekilde ifade edilebilir:

${ displaystyle { begin {case} h_ {0} = 0 h_ {k + 1} = h_ {k} + { dfrac { sum _ {x} w (x) F '(x + h_ { k}) left [G (x) -F (x + h_ {k}) sağ]} { toplamı _ {x} w (x) F '(x + h_ {k}) ^ {2}} } end {vakalar}}}$

Verim

Değerlendirmek için verim Algoritmanın hangi koşullarda ve ne kadar hızlı olduğunu doğal olarak merak ediyoruz. ${ displaystyle h_ {k}}$ gerçeğe yakınlaşır ${ displaystyle h}$ .
Durumu düşünün:

{ displaystyle F (x) = sin x,}

{ displaystyle G (x) = F (x + h) = sin (x + h).}

Kayıt algoritmasının her iki versiyonu da doğru olana yakınsar. ${ displaystyle h}$ için ${ displaystyle sol vert h sağ vert < pi}$ yani. yarım dalga boyu kadar büyük ilk yanlış kayıtlar için. Yakınsama aralığı, görüntüdeki yüksek uzamsal frekansları bastırarak geliştirilebilir; yumuşatma küçük ayrıntılarını da istenmeyen bir şekilde bastıracak olan görüntü. Düzgünleştirme penceresi, eşleşen nesnenin boyutundan çok daha büyükse, nesne tamamen bastırılabilir, böylece bir eşleşme artık mümkün olmaz.

Düşükgeçiren filtrelenmiş görüntüler daha düşük düzeyde örneklenebildiğinden çözüm hiçbir bilgi kaybı olmaksızın, genelden özüne bir strateji benimsenir. Yaklaşık bir eşleşme elde etmek için görüntünün düşük çözünürlüklü düzleştirilmiş bir versiyonu kullanılabilir. Algoritmanın daha yüksek çözünürlüklü görüntülere uygulanması, daha düşük çözünürlükte elde edilen eşleşmeyi iyileştirecektir.

Düzgünleştirme yakınsama aralığını genişletirken, ağırlıklandırma işlevi yakınsamayı hızlandırarak yaklaşımın doğruluğunu iyileştirir. ${ displaystyle h_ {1}}$ ile ilk yinelemenin ${ displaystyle F (x) = sin x}$ Yer değiştirme yarım dalga boyuna yaklaştıkça sıfıra düşer.

Uygulama

Uygulama, miktarların ağırlıklı toplamlarının hesaplanmasını gerektirir ${ displaystyle F'G,}$ ${ displaystyle F'F,}$ ve ${ displaystyle (F ') ^ {2}}$ ilgi bölgesi üzerinde ${ displaystyle R.}$ olmasına rağmen ${ displaystyle F '(x)}$ tam olarak hesaplanamaz, şu şekilde tahmin edilebilir:

{ displaystyle F '(x) yaklaşık { dfrac {F (x + Delta x) -F (x)} { Delta x}}}

nerede ${ displaystyle Delta x}$ uygun şekilde küçük seçilir.
İlk türevleri tahmin etmek için bazı karmaşık teknikler kullanılabilir, ancak genel olarak bu tür teknikler önce fonksiyonu yumuşatmak ve sonra farkı almakla eşdeğerdir.

Birden çok boyuta genelleme

1-D ve 2-D için kayıt algoritması daha fazla boyuta genellenebilir. Bunu yapmak için L'yi en aza indirmeye çalışıyoruz₂ norm hata ölçüsü:

{ displaystyle E = toplamı _ { mathbf {x} in R} sol [F ( mathbf {x} + mathbf {h}) -G ( mathbf {x}) sağ] ^ {2 },}

nerede ${ displaystyle mathbf {x}}$ ve ${ displaystyle mathbf {h}}$ n boyutlu satır vektörleridir.
Doğrusal bir yaklaşım benzerliği:

{ displaystyle F ( mathbf {x} + mathbf {h}) yaklaşık F ( mathbf {x}) + mathbf {h} sol ({ dfrac { kısmi} { kısmi mathbf {x }}} F ( mathbf {x}) sağ) ^ {T}.}

Ve kısmen farklılaştırmak ${ displaystyle E}$ göre ${ displaystyle mathbf {h}}$ :

{ displaystyle { begin {align} 0 & = { dfrac { kısmi E} { kısmi mathbf {h}}} & yaklaşık { dfrac { kısmi} { kısmi mathbf {h}} } toplam _ { mathbf {x}} left [F ( mathbf {x}) + mathbf {h} left ({ dfrac { kısmi F} { kısmi mathbf {x}}} sağ) ^ {T} -G ( mathbf {x}) sağ] ^ {2} & = sum _ { mathbf {x}} 2 left [F ( mathbf {x}) + mathbf {h} left ({ dfrac { kısmi F} { kısmi mathbf {x}}} sağ) ^ {T} -G ( mathbf {x}) sağ] sol ({ dfrac { kısmi F} { kısmi mathbf {x}}} sağ) uç {hizalı}}}

,

{ displaystyle Rightarrow mathbf {h} yaklaşık sol [ toplamı _ { mathbf {x}} sol [G ( mathbf {x}) -F ( mathbf {x}) sağ] sol ({ dfrac { kısmi F} { kısmi mathbf {x}}} sağ) sağ] left [ sum _ { mathbf {x}} left ({ dfrac { kısmi F} { kısmi mathbf {x}}} sağ) ^ {T} left ({ dfrac { kısmi F} { kısmi mathbf {x}}} sağ) sağ] ^ {- 1},}

1-D versiyonu ile hemen hemen aynı forma sahiptir.

Diğer genellemeler

Yöntem ayrıca, döndürme, ölçekleme ve kesme gibi daha karmaşık dönüşümlere dayanan kaydı hesaba katacak şekilde genişletilebilir.

{ displaystyle G (x) = F (Ax + h),}

nerede ${ displaystyle A}$ doğrusal bir uzaysal dönüşümdür. En aza indirilecek hata o zaman

{ displaystyle E = toplam _ {x} sol [F (Ax + h) -G (x) sağ] ^ {2}.}

Miktarı belirlemek için ${ displaystyle Delta A}$ ayarlamak ${ displaystyle A}$ ve ${ displaystyle Delta h}$ ayarlamak ${ displaystyle h}$ yine doğrusal yaklaşımı kullanın:

{ Displaystyle F (x (A + Delta A) + (h + Delta h))}

{ displaystyle yaklaşık F (Ax + h) + ( Delta Ax + Delta h) { dfrac { kısmi} { kısmi x}} F (x).}

Kestirim, benzer şekilde, minimize edilecek miktarlarda ikinci dereceden hale gelen hata ifadesini bulmak için kullanılabilir. Hata ifadesini bulduktan sonra, onu en aza indirilecek miktarlara göre farklılaştırın ve sonuçları sıfır olarak ayarlayın, bir dizi doğrusal denklem elde edin, sonra bunları çözün.

Kameraların bakış açılarının farklılığından veya iki görüntünün işlenmesindeki farklılıklardan dolayı parlaklığın iki görünümde farklı olabileceği gerçeğini açıklamak için başka bir genelleme tasarlanmıştır. Farkı doğrusal dönüşüm olarak varsayalım:

{ displaystyle F (x) = alpha G (x) + beta,}

nerede ${ displaystyle alpha}$ bir kontrast ayarını temsil eder ve ${ displaystyle beta}$ bir parlaklık ayarını temsil eder.
Bu ifadeyi genel doğrusal dönüşüm kayıt problemi ile birleştirmek:

{ displaystyle E = toplamı _ {x} sol [F (Ax + h) - ( alfa G (x) + beta) sağ] ^ {2}}

göre en aza indirilecek miktar olarak ${ displaystyle alpha,}$ ${ displaystyle beta,}$ ${ displaystyle A}$ ve ${ displaystyle h.}$

Nokta özelliklerinin tespiti ve takibi

İkinci makale Tomasi ve Kanade'de^[2]çeviri nedeniyle kaydı bulmak için aynı temel yöntemi kullandı, ancak izleme algoritmasına uygun özellikleri izleyerek tekniği geliştirdi. Gradyan matrisinin her iki öz değeri de bazı eşik değerlerinden daha büyükse önerilen özellikler seçilecektir.

Çok benzer bir türetmeyle, problem şu şekilde formüle edilir:

{ displaystyle nabla d = e ,}

nerede ${ displaystyle nabla}$ gradyandır. Bu, Lucas-Kanade'nin yukarıdaki son formülü ile aynıdır. Yerel bir yama, iki özdeğerin her ikisinin de ( ${ displaystyle lambda _ {1}}$ ve ${ displaystyle lambda _ {2}}$ ) nın-nin ${ displaystyle nabla}$ eşikten daha büyüktür.

Bu iki belgeye dayalı bir izleme yöntemi genellikle bir KLT izleyici olarak kabul edilir.

İyileştirmeler ve varyasyonlar

Üçüncü bir makalede, Shi ve Tomasi^[3] özelliklerin doğru bir şekilde izlendiğini doğrulamak için ek bir aşama önerdi.

Bir afin dönüşüm, halihazırda izlenen özelliğin görüntüsü ile ardışık olmayan bir önceki çerçeveden görüntüsü arasına sığdırılır. Afin telafi edilmiş görüntü çok farklıysa, özellik atılır.

Gerekçe, ardışık çerçeveler arasında bir çevirinin izleme için yeterli bir model olması, ancak daha karmaşık hareket, perspektif efektleri vb. Nedeniyle çerçeveler daha uzak olduğunda daha karmaşık bir modelin gerekli olmasıdır.

KLT, Shi ve Tomasi için benzer bir türetme kullanmak, aramanın formül kullanılarak yapılabileceğini gösterdi.

{ displaystyle Tz = a ,}

nerede ${ displaystyle T}$ gradyanların bir matrisidir, ${ displaystyle z}$ afin katsayıların bir vektörüdür ve ${ displaystyle a}$ bir hata vektörüdür. Bunu şununla karşılaştır: ${ displaystyle nabla d = e}$ .

Referanslar

^ Bruce D. Lucas ve Takeo Kanade. Stereo Vision Uygulamasına Sahip Yinelemeli Görüntü Kayıt Tekniği. Uluslararası Yapay Zeka Ortak Konferansı, sayfalar 674–679, 1981.
^ Carlo Tomasi ve Takeo Kanade. Nokta Özelliklerinin Tespiti ve İzlenmesi. Carnegie Mellon Üniversitesi Teknik Raporu CMU-CS-91-132, Nisan 1991.
^ Jianbo Shi ve Carlo Tomasi. İzlenecek İyi Özellikler. Bilgisayarlı Görü ve Örüntü Tanıma IEEE Konferansı, sayfalar 593–600, 1994.

Ayrıca bakınız

Kanade-Tomasi özellikleri özellik algılama bağlamında
Lucas-Kanade yöntemi Referans 1'den türetilen bir optik akış algoritması.

[LK-1] Bruce D. Lucas ve Takeo Kanade. Stereo Vision Uygulamasına Sahip Yinelemeli Görüntü Kayıt Tekniği. Uluslararası Yapay Zeka Ortak Konferansı, sayfalar 674–679, 1981.

[TK-2] Carlo Tomasi ve Takeo Kanade. Nokta Özelliklerinin Tespiti ve İzlenmesi. Carnegie Mellon Üniversitesi Teknik Raporu CMU-CS-91-132, Nisan 1991.

[ST-3] Jianbo Shi ve Carlo Tomasi. İzlenecek İyi Özellikler. Bilgisayarlı Görü ve Örüntü Tanıma IEEE Konferansı, sayfalar 593–600, 1994.

[1]

[2]

[3]