Sobel operatörü - Sobel operator

Buhar makinesinin renkli resmi

Sobel operatörü bu görüntüye uygulandı

Sobel operatörübazen denir Sobel-Feldman operatörü veya Sobel filtresi, kullanılır görüntü işleme ve Bilgisayar görüşü özellikle içinde Kenar algılama kenarları vurgulayan bir görüntü oluşturduğu algoritmalar. Adını almıştır Irwin Sobel ve Stanford Yapay Zeka Laboratuvarı'ndaki (SAIL) meslektaşları Gary Feldman. Sobel ve Feldman bir "İzotropik 3x3 Image Gradient Operator "1968'de SAIL'de bir konuşmada.^[1] Teknik olarak, bu bir ayrık farklılaştırma operatörü yaklaşık bir değer hesaplayarak gradyan görüntü yoğunluğu işlevinin Görüntünün her noktasında Sobel – Feldman operatörünün sonucu ya karşılık gelen gradyan vektörüdür ya da norm Bu vektörün. Sobel-Feldman operatörü, görüntünün yatay ve dikey yönlerde küçük, ayrılabilir ve tamsayı değerli bir filtre ile kıvrılmasına dayanır ve bu nedenle hesaplamalar açısından nispeten ucuzdur. Öte yandan, ürettiği gradyan yaklaşımı, özellikle görüntüdeki yüksek frekanslı varyasyonlar için nispeten kabadır.

Formülasyon

Operatör, iki adet 3x3 çekirdek kullanır. kıvrımlı orijinal görüntü ile yaklaşık olarak türevler - biri yatay, diğeri dikey değişiklikler için. Eğer tanımlarsak Bir kaynak görüntü olarak ve G_x ve G_y her noktada sırasıyla yatay ve dikey türev yaklaşımlarını içeren iki görüntüdür, hesaplamalar aşağıdaki gibidir:^[2]

{ displaystyle mathbf {G} _ {x} = { begin {bmatrix} + 1 & 0 & -1 + 2 & 0 & -2 + 1 & 0 & -1 end {bmatrix}} * mathbf {A} quad { mbox {ve}} quad mathbf {G} _ {y} = { begin {bmatrix} + 1 & + 2 & + 1 0 & 0 & 0 - 1 & -2 & -1 end {bmatrix}} * mathbf {A}}

nerede ${ displaystyle *}$ burada 2 boyutlu sinyal işlemeyi ifade eder kıvrım operasyon.

Sobel çekirdekleri, bir ortalama alma ve bir farklılaşma çekirdeğinin ürünleri olarak ayrıştırılabildiğinden, gradyanı yumuşatma ile hesaplarlar. Örneğin, ${ displaystyle mathbf {G} _ {x}}$ olarak yazılabilir

{ displaystyle mathbf {G} _ {x} = { begin {bmatrix} 1 2 1 end {bmatrix}} * left ({ begin {bmatrix} + 1 & 0 & -1 end {bmatrix }} * mathbf {A} right) quad { mbox {ve}} quad mathbf {G} _ {y} = { begin {bmatrix} +1 0 - 1 end { bmatrix}} * left ({ begin {bmatrix} 1 ve 2 ve 1 end {bmatrix}} * mathbf {A} sağ)}

x-Kordinat burada "doğru" yönde artan olarak tanımlanır ve yKoordinat, "aşağı" yönde artan olarak tanımlanır. Görüntünün her noktasında, elde edilen gradyan yaklaşımları aşağıdakiler kullanılarak gradyan büyüklüğünü vermek için birleştirilebilir:

{ displaystyle mathbf {G} = { sqrt {{ mathbf {G} _ {x}} ^ {2} + { mathbf {G} _ {y}} ^ {2}}}}

Bu bilgiyi kullanarak gradyanın yönünü de hesaplayabiliriz:

{ displaystyle mathbf { Theta} = operatorname {atan} sol ({ mathbf {G} _ {y} over mathbf {G} _ {x}} sağ)}

nerede, örneğin, Θ Sağ tarafta daha açık olan dikey kenar için 0'dır.

Daha resmi

Bir dijital görüntünün yoğunluk işlevi yalnızca ayrı noktalarda bilindiğinden, bu işlevin türevleri, görüntü noktalarında örneklenmiş bir temelde yatan farklılaştırılabilir yoğunluk işlevi olduğunu varsaymadıkça tanımlanamaz. Bazı ek varsayımlarla, sürekli yoğunluk fonksiyonunun türevi, örneklenen yoğunluk fonksiyonu, yani dijital görüntü üzerinde bir fonksiyon olarak hesaplanabilir. Herhangi bir noktadaki türevlerin, neredeyse tüm görüntü noktalarında yoğunluk değerlerinin fonksiyonları olduğu ortaya çıktı. Bununla birlikte, bu türev fonksiyonlarının yaklaşımları, daha az veya daha büyük doğruluk derecelerinde tanımlanabilir.

Sobel-Feldman operatörü, görüntü gradyanının oldukça yanlış bir yaklaşımını temsil eder, ancak yine de birçok uygulamada pratik kullanım için yeterli kaliteye sahiptir. Daha kesin olarak, karşılık gelen görüntü gradyanını yaklaştırmak için her bir görüntü noktasının etrafındaki yoğunluk değerlerini yalnızca 3x3 bölgesinde kullanır ve gradyan yaklaşımını oluşturmak için görüntü yoğunluklarını ağırlıklandıran katsayılar için yalnızca tam sayı değerlerini kullanır.

Diğer boyutlara genişletme

Sobel-Feldman operatörü iki ayrılabilir işlemden oluşur:^[3]

Üçgen filtre ile türev yönüne dik düzeltme: ${ displaystyle h (-1) = 1, h (0) = 2, h (1) = 1}$
Türev yönündeki basit merkezi fark: ${ displaystyle h '(- 1) = 1, h' (0) = 0, h '(1) = - 1}$

Sobel – Feldman filtreleri görüntü türevleri farklı boyutlarda ${ displaystyle x, y, z, t in sol {0, -1,1 sağ }}$ :

1D: ${ displaystyle h_ {x} '(x) = h' (x);}$

2D: ${ displaystyle h_ {x} '(x, y) = h' (x) h (y)}$

3 BOYUTLU: ${ displaystyle h_ {x} '(x, y, z) = h' (x) h (y) h (z)}$

4D: ${ displaystyle h_ {x} '(x, y, z, t) = h' (x) h (y) h (z) h (t)}$

Böylece, bir örnek olarak 3D Sobel – Feldman çekirdeği zyön:

{ displaystyle h_ {z} '(:,:, - 1) = { begin {bmatrix} + 1 & + 2 & + 1 + 2 & + 4 & + 2 + 1 & + 2 & + 1 end {bmatrix} } quad h_ {z} '(:,:, 0) = { begin {bmatrix} 0 & 0 & 0 0 & 0 & 0 0 & 0 & 0 end {bmatrix}} quad h_ {z}' (:,:, 1) = { begin {bmatrix} -1 & -2 & -1 - 2 & -4 & -2 - 1 & -2 & -1 end {bmatrix}}}

Teknik detaylar

Tanımının bir sonucu olarak, Sobel operatörü hem donanım hem de yazılımda basit yollarla uygulanabilir: karşılık gelen sonucu hesaplamak için bir nokta etrafında yalnızca sekiz görüntü noktası gerekir ve gradyan vektör yaklaşımını hesaplamak için yalnızca tamsayı aritmetiği gerekir. Ayrıca, yukarıda açıklanan iki ayrı filtrenin her ikisi de ayrılabilir:

{ displaystyle { begin {bmatrix} 1 & 0 & -1 2 & 0 & -2 1 & 0 & -1 end {bmatrix}} = { begin {bmatrix} 1 2 1 end {bmatrix}} { başlangıç ​​{bmatrix} 1 & 0 & -1 end {bmatrix}} = { begin {bmatrix} 1 1 end {bmatrix}} * { begin {bmatrix} 1 1 end {bmatrix}} { begin {bmatrix} 1 & -1 end {bmatrix}} * { begin {bmatrix} 1 & 1 end {bmatrix}}}

{ displaystyle { begin {bmatrix} 1 & 2 & 1 0 & 0 & 0 - 1 & -2 & -1 end {bmatrix}} = { begin {bmatrix} 1 0 - 1 end {bmatrix}} { begin {bmatrix} 1 & 2 & 1 end {bmatrix}} = { begin {bmatrix} 1 1 end {bmatrix}} * { begin {bmatrix} 1 - 1 end {bmatrix}} { begin {bmatrix} 1 & 1 end {bmatrix}} * { begin {bmatrix} 1 & 1 end {bmatrix}}}

ve iki türev G_x ve G_y bu nedenle şu şekilde hesaplanabilir

{ displaystyle mathbf {G} _ {x} = { begin {bmatrix} 1 2 1 end {bmatrix}} * sol ({ begin {bmatrix} 1 & 0 & -1 end {bmatrix} } * mathbf {A} right) quad { mbox {ve}} quad mathbf {G} _ {y} = { begin {bmatrix} 1 0 - 1 son {bmatrix}} * left ({ begin {bmatrix} 1 & 2 & 1 end {bmatrix}} * mathbf {A} right)}

Bazı uygulamalarda, bu ayrılabilir hesaplama avantajlı olabilir çünkü her görüntü noktası için daha az aritmetik hesaplama gerektirir.

Evrişim uygulamak K piksel grubuna P sözde kodda şu şekilde temsil edilebilir:

N (x, y) = {K (i, j) .P (x-i, y-j)} toplamı, i, j için -1'den 1'e kadar.

N (x, y) Evrişim uygulandıktan sonra ortaya çıkan yeni matrisi temsil eder K -e P, nerede P piksel matrisidir.

Misal

Sobel – Feldman operatörünün sonucu, her noktadaki gradyanın 2 boyutlu bir haritasıdır. Yüksek gradyanlı alanlar (olası kenarlar) beyaz çizgiler olarak görülebilen, kendisi bir görüntüymiş gibi işlenebilir ve görüntülenebilir. Aşağıdaki resimler, Sobel-Feldman operatörünün hesaplamasını basit bir resim üzerinde göstererek bunu göstermektedir.

Tuğla duvar ve bisiklet askısının gri tonlamalı test görüntüsü	Sobel – Feldman operatöründen normalleştirilmiş gradyan büyüklüğü
Normalleştirilmiş xSobel – Feldman operatöründen gradyan	Normalleştirilmiş ySobel – Feldman operatöründen gradyan

Aşağıdaki resimler, gri tonlamalı bir daire üzerindeki gradyan yönündeki değişikliği göstermektedir. İşareti ne zaman ${ displaystyle mathbf {G_ {x}}}$ ve ${ displaystyle mathbf {G_ {y}}}$ aynıdır, gradyanın açısı pozitiftir ve farklı olduğunda negatiftir. Aşağıdaki örnekte, dairenin kenarındaki kırmızı ve sarı renkler pozitif açıları, mavi ve camgöbeği renkleri negatif açıları belirtir. Dairenin sol ve sağ taraflarındaki dikey kenarların açısı 0'dır çünkü ${ displaystyle mathbf {G_ {y}}}$ . Çemberin üst ve alt kenarlarındaki yatay kenarların açıları - $π$ /2 ve $π$ /2 sırasıyla yerel bir değişiklik olmadığı için ${ displaystyle mathbf {G_ {x}}}$ . Üst kenar için negatif açı, geçişin parlaktan koyu bölgeye olduğunu belirtir ve alt kenar için pozitif açı, karanlıktan parlak bölgeye geçişi belirtir. Her ikisinde de yerel değişiklik olmadığı için diğer tüm pikseller siyah olarak işaretlenmiştir. ${ displaystyle mathbf {G_ {x}}}$ veya ${ displaystyle mathbf {G_ {y}}}$ ve dolayısıyla açı tanımlanmamıştır. Açı oranının bir fonksiyonu olduğu için ${ displaystyle mathbf {G_ {y}}}$ -e ${ displaystyle mathbf {G_ {x}}}$ küçük değişim oranlarına sahip pikseller yine de büyük bir açılı tepkiye sahip olabilir. Sonuç olarak, gürültü tipik olarak istenmeyen bir geniş açılı tepkiye sahip olabilir. Görüntü işleme uygulamaları için gradyan açısı bilgilerini kullanırken, kaldırmak için çaba gösterilmelidir. görüntü gürültüsü bu yanlış yanıtı azaltmak için.

Beyaz arka plana sahip siyah bir dairenin gri tonlamalı görüntüsü.

Sobel operatörünün gradyanının yönü.

Alternatif operatörler

Sobel-Feldman operatörü, saf merkezi farklar operatörü ile ilişkili artefaktları azaltırken, mükemmel dönüş simetrisine sahip değildir. Scharr bu mülkü optimize etme konusuna baktı.^[4]^[5] Burada 5 x 5 boyutuna kadar filtre çekirdekleri sunulmuştur, ancak en sık kullanılanı:

{ displaystyle { begin {bmatrix} + 3 & 0 & -3 + 10 & 0 & -10 + 3 & 0 & -3 end {bmatrix}} { begin {bmatrix} + 3 & + 10 & +3 0 & 0 & 0 - 3 & -10 & -3 end {bmatrix}}}

Bu faktörler benzer şekilde:

${ displaystyle { begin {bmatrix} 3 ve 10 ve 3 end {bmatrix}} = { begin {bmatrix} 3 ve 1 end {bmatrix}} * { begin {bmatrix} 1 ve 3 end {bmatrix}}}$

Scharr operatörleri Fourier alanında ağırlıklı ortalama kare açısal hatayı en aza indiren bir optimizasyonun sonucudur. Bu optimizasyon, elde edilen filtrelerin sayısal olarak tutarlı olması koşuluyla yapılır. Bu nedenle, sadece simetri kısıtlamalarını korumaktan çok türev çekirdeklerdir. Scharr'ın teorisinden kaynaklanan optimum 8 bit tam sayı değerli 3x3 filtre

{ displaystyle { begin {bmatrix} 47 & 0 & -47 162 & 0 & -162 47 & 0 & -47 end {bmatrix}} { begin {bmatrix} 47 & 162 & 47 0 & 0 & 0 - 47 & -162 ve -47 end {bmatrix}}}

Benzer bir optimizasyon stratejisi ve ortaya çıkan filtreler de Farid ve Simoncelli tarafından sunuldu.^[6]^[7] Ayrıca yüksek mertebeden türev şemalarını da araştırırlar. Scharr'ın çalışmasının aksine, bu filtreler sayısal olarak tutarlı olmaya zorlanmaz.

Türev filtre tasarımı sorunu yeniden ele alındı, ör. Kroon tarafından.^[8]

Rasgele kübik eğriye dayalı türev filtreleri Hast tarafından sunuldu.^[9] Birinci ve ikinci dereceden türevlerin, 7 uzunluğunda filtreler veren çift filtreleme yaklaşımıyla kübik veya trigonometrik eğriler kullanılarak nasıl doğru şekilde hesaplanabileceğini gösterdi.

Orijinal olarak Sobel operatöründen üretilen bir diğer benzer operatör Kayyalı operatörüdür,^[10] mükemmel bir rotasyonel simetri tabanlı evrişim filtresi 3x3.

Oryantasyon-optimal türev çekirdekleri, optik akış tahminindeki sistematik tahmin hatalarını büyük ölçüde azaltır. Daha da yüksek doğruluk ve genişletilmiş optik akış tahmini için optimize edilmiş filtre ailelerine sahip daha büyük şemalar, Scharr tarafından sonraki çalışmalarda sunulmuştur.^[11] Şeffaf hareket kestirimi için ikinci dereceden türev filtre setleri incelenmiştir.^[12] Ortaya çıkan çekirdekler ne kadar büyükse, Gauss filtrelerinin Türevine o kadar iyi yaklaştıkları görülmüştür.

Örnek karşılaştırmalar

Burada, test görüntüsünün gradyan büyüklüğünü tahmin etmek için dört farklı gradyan operatörü kullanılır.

Tuğla duvar ve bisiklet askısının gri tonlamalı test görüntüsü	Sobel – Feldman operatöründen gradyan büyüklüğü	Scharr operatöründen gradyan büyüklüğü
Gradyan büyüklüğü Roberts Cross Şebeke	Gradyan büyüklüğü Prewitt operatörü

Sözde kod uygulaması

işleviSobel(A: iki boyutlu görüntü dizisi olarak)	Gx = [-1 0 1; -2 0 2; -1 0 1]	Gy = [-1 -2 -1; 0 0 0; 1 2 1]		satırlar = boyut(Bir, 1)	sütunlar = boyut(Bir, 2)	mag = sıfırlar(Bir)için i = 1: satırlar-2için j = 1: sütunlar-2			S1 = toplam(toplam(Gx.*Bir(ben:ben+2,j:j+2)))			S2 = toplam(toplam(Gy.*Bir(ben:ben+2,j:j+2)))			mag(ben+1, j+1) = sqrt(S1.^2+S2.^2)son içinson için		eşik = 70 % uygulama için değişiklik gösterir [0 255]	output_image = max(mag, eşik)	output_image(output_image == yuvarlak(eşik)) = 0;dönüş output_imageson işlevi

Ayrıca bakınız

Referanslar

^ Irwin Sobel, 2014, Sobel Operatörünün Tarihçesi ve Tanımı
^ Özellik Dedektörleri - Sobel Kenar Dedektörü
^ K. Engel (2006). Gerçek zamanlı hacim grafikleri. s. 112–114.
^ Scharr, Hanno, 2000, Tez (Almanca), Dijital Görüntü İşlemede Optimal Operatörler.
^ B. Jähne, H. Scharr ve S. Körkel. Filtre tasarımının ilkeleri. Bilgisayarla Görme ve Uygulamalar El Kitabında. Academic Press, 1999.
^ H. Farid ve E. P. Simoncelli, Optimal Dönme Eşdeğeri Yönlü Türev Çekirdekler, Int'l Conf Computer Analysis of Images and Patterns, s. 207–214, Eylül 1997.
^ H. Farid ve E. P. Simoncelli, Ayrık çok boyutlu sinyallerin farklılaşması, IEEE Trans Image Processing, cilt 13 (4), s. 496–508, Nisan 2004.
^ D. Kroon, 2009, Kısa Makale Twente Üniversitesi, Çekirdek Tabanlı Görüntü Türevlerinin Sayısal Optimizasyonu.
^ A. Hast., "Çift filtreleme yaklaşımıyla birinci ve ikinci dereceden türevler için basit filtre tasarımı", Örüntü Tanıma Mektupları, Cilt. 42, no. 1 Haziran, s. 65–71. 2014.
^ Dim, Jules R .; Takamura, Tamio (2013-12-11). "Uydu Bulutu Sınıflandırması için Alternatif Yaklaşım: Edge Gradient Uygulaması". Meteorolojideki Gelişmeler. 2013: 1–8. doi:10.1155/2013/584816. ISSN 1687-9309.
^ Scharr Hanno (2007). "Genişletilmiş Optik Akış için Optimum Filtreler". Karmaşık Hareket. Bilgisayar Bilimlerinde Ders Notları. 3417. Berlin, Heidelberg: Springer Berlin Heidelberg. sayfa 14–29. doi:10.1007/978-3-540-69866-1_2. ISBN 978-3-540-69864-7.
^ Scharr, Hanno, ŞEFFAF HAREKET TAHMİNİ İÇİN OPTİMAL İKİNCİ SİPARİŞ TÜREV FİLTRE AİLELERİ 15. Avrupa Sinyal İşleme Konferansı (EUSIPCO 2007), Poznan, Polonya, 3–7 Eylül 2007.

Dış bağlantılar

Opencv'de Sobel kenar algılama
Sobel Filtresi, içinde SciPy Python Kitaplığı
Irwin Sobel için bibliyografik alıntılar içinde DBLP
Bilgisayar algoritmalarını kullanan Sobel kenar algılama örneği

[1] Irwin Sobel, 2014, Sobel Operatörünün Tarihçesi ve Tanımı

[2] Özellik Dedektörleri - Sobel Kenar Dedektörü

[3] K. Engel (2006). Gerçek zamanlı hacim grafikleri. s. 112–114.

[4] Scharr, Hanno, 2000, Tez (Almanca), Dijital Görüntü İşlemede Optimal Operatörler.

[5] B. Jähne, H. Scharr ve S. Körkel. Filtre tasarımının ilkeleri. Bilgisayarla Görme ve Uygulamalar El Kitabında. Academic Press, 1999.

[6] H. Farid ve E. P. Simoncelli, Optimal Dönme Eşdeğeri Yönlü Türev Çekirdekler, Int'l Conf Computer Analysis of Images and Patterns, s. 207–214, Eylül 1997.

[7] H. Farid ve E. P. Simoncelli, Ayrık çok boyutlu sinyallerin farklılaşması, IEEE Trans Image Processing, cilt 13 (4), s. 496–508, Nisan 2004.

[8] D. Kroon, 2009, Kısa Makale Twente Üniversitesi, Çekirdek Tabanlı Görüntü Türevlerinin Sayısal Optimizasyonu.

[9] A. Hast., "Çift filtreleme yaklaşımıyla birinci ve ikinci dereceden türevler için basit filtre tasarımı", Örüntü Tanıma Mektupları, Cilt. 42, no. 1 Haziran, s. 65–71. 2014.

[10] Dim, Jules R .; Takamura, Tamio (2013-12-11). "Uydu Bulutu Sınıflandırması için Alternatif Yaklaşım: Edge Gradient Uygulaması". Meteorolojideki Gelişmeler. 2013: 1–8. doi:10.1155/2013/584816. ISSN 1687-9309.

[Scharr_pp._14–29-11] Scharr Hanno (2007). "Genişletilmiş Optik Akış için Optimum Filtreler". Karmaşık Hareket. Bilgisayar Bilimlerinde Ders Notları. 3417. Berlin, Heidelberg: Springer Berlin Heidelberg. sayfa 14–29. doi:10.1007/978-3-540-69866-1_2. ISBN 978-3-540-69864-7.

[12] Scharr, Hanno, ŞEFFAF HAREKET TAHMİNİ İÇİN OPTİMAL İKİNCİ SİPARİŞ TÜREV FİLTRE AİLELERİ 15. Avrupa Sinyal İşleme Konferansı (EUSIPCO 2007), Poznan, Polonya, 3–7 Eylül 2007.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]