Sobel operatörü - Sobel operator

Buhar makinesinin renkli resmi
Sobel operatörü bu görüntüye uygulandı

Sobel operatörübazen denir Sobel-Feldman operatörü veya Sobel filtresi, kullanılır görüntü işleme ve Bilgisayar görüşü özellikle içinde Kenar algılama kenarları vurgulayan bir görüntü oluşturduğu algoritmalar. Adını almıştır Irwin Sobel ve Stanford Yapay Zeka Laboratuvarı'ndaki (SAIL) meslektaşları Gary Feldman. Sobel ve Feldman bir "İzotropik 3x3 Image Gradient Operator "1968'de SAIL'de bir konuşmada.[1] Teknik olarak, bu bir ayrık farklılaştırma operatörü yaklaşık bir değer hesaplayarak gradyan görüntü yoğunluğu işlevinin Görüntünün her noktasında Sobel – Feldman operatörünün sonucu ya karşılık gelen gradyan vektörüdür ya da norm Bu vektörün. Sobel-Feldman operatörü, görüntünün yatay ve dikey yönlerde küçük, ayrılabilir ve tamsayı değerli bir filtre ile kıvrılmasına dayanır ve bu nedenle hesaplamalar açısından nispeten ucuzdur. Öte yandan, ürettiği gradyan yaklaşımı, özellikle görüntüdeki yüksek frekanslı varyasyonlar için nispeten kabadır.

Formülasyon

Operatör, iki adet 3x3 çekirdek kullanır. kıvrımlı orijinal görüntü ile yaklaşık olarak türevler - biri yatay, diğeri dikey değişiklikler için. Eğer tanımlarsak Bir kaynak görüntü olarak ve Gx ve Gy her noktada sırasıyla yatay ve dikey türev yaklaşımlarını içeren iki görüntüdür, hesaplamalar aşağıdaki gibidir:[2]

nerede burada 2 boyutlu sinyal işlemeyi ifade eder kıvrım operasyon.

Sobel çekirdekleri, bir ortalama alma ve bir farklılaşma çekirdeğinin ürünleri olarak ayrıştırılabildiğinden, gradyanı yumuşatma ile hesaplarlar. Örneğin, olarak yazılabilir

x-Kordinat burada "doğru" yönde artan olarak tanımlanır ve yKoordinat, "aşağı" yönde artan olarak tanımlanır. Görüntünün her noktasında, elde edilen gradyan yaklaşımları aşağıdakiler kullanılarak gradyan büyüklüğünü vermek için birleştirilebilir:

Bu bilgiyi kullanarak gradyanın yönünü de hesaplayabiliriz:

nerede, örneğin, Θ Sağ tarafta daha açık olan dikey kenar için 0'dır.

Daha resmi

Bir dijital görüntünün yoğunluk işlevi yalnızca ayrı noktalarda bilindiğinden, bu işlevin türevleri, görüntü noktalarında örneklenmiş bir temelde yatan farklılaştırılabilir yoğunluk işlevi olduğunu varsaymadıkça tanımlanamaz. Bazı ek varsayımlarla, sürekli yoğunluk fonksiyonunun türevi, örneklenen yoğunluk fonksiyonu, yani dijital görüntü üzerinde bir fonksiyon olarak hesaplanabilir. Herhangi bir noktadaki türevlerin, neredeyse tüm görüntü noktalarında yoğunluk değerlerinin fonksiyonları olduğu ortaya çıktı. Bununla birlikte, bu türev fonksiyonlarının yaklaşımları, daha az veya daha büyük doğruluk derecelerinde tanımlanabilir.

Sobel-Feldman operatörü, görüntü gradyanının oldukça yanlış bir yaklaşımını temsil eder, ancak yine de birçok uygulamada pratik kullanım için yeterli kaliteye sahiptir. Daha kesin olarak, karşılık gelen görüntü gradyanını yaklaştırmak için her bir görüntü noktasının etrafındaki yoğunluk değerlerini yalnızca 3x3 bölgesinde kullanır ve gradyan yaklaşımını oluşturmak için görüntü yoğunluklarını ağırlıklandıran katsayılar için yalnızca tam sayı değerlerini kullanır.

Diğer boyutlara genişletme

Sobel-Feldman operatörü iki ayrılabilir işlemden oluşur:[3]

  • Üçgen filtre ile türev yönüne dik düzeltme:
  • Türev yönündeki basit merkezi fark:

Sobel – Feldman filtreleri görüntü türevleri farklı boyutlarda  :

1D:

2D:

3 BOYUTLU:

4D:

Böylece, bir örnek olarak 3D Sobel – Feldman çekirdeği zyön:

Teknik detaylar

Tanımının bir sonucu olarak, Sobel operatörü hem donanım hem de yazılımda basit yollarla uygulanabilir: karşılık gelen sonucu hesaplamak için bir nokta etrafında yalnızca sekiz görüntü noktası gerekir ve gradyan vektör yaklaşımını hesaplamak için yalnızca tamsayı aritmetiği gerekir. Ayrıca, yukarıda açıklanan iki ayrı filtrenin her ikisi de ayrılabilir:

ve iki türev Gx ve Gy bu nedenle şu şekilde hesaplanabilir

Bazı uygulamalarda, bu ayrılabilir hesaplama avantajlı olabilir çünkü her görüntü noktası için daha az aritmetik hesaplama gerektirir.

Evrişim uygulamak K piksel grubuna P sözde kodda şu şekilde temsil edilebilir:

N (x, y) = {K (i, j) .P (x-i, y-j)} toplamı, i, j için -1'den 1'e kadar.

N (x, y) Evrişim uygulandıktan sonra ortaya çıkan yeni matrisi temsil eder K -e P, nerede P piksel matrisidir.

Misal

Sobel – Feldman operatörünün sonucu, her noktadaki gradyanın 2 boyutlu bir haritasıdır. Yüksek gradyanlı alanlar (olası kenarlar) beyaz çizgiler olarak görülebilen, kendisi bir görüntüymiş gibi işlenebilir ve görüntülenebilir. Aşağıdaki resimler, Sobel-Feldman operatörünün hesaplamasını basit bir resim üzerinde göstererek bunu göstermektedir.

Tuğla duvar ve bisiklet askısının gri tonlamalı test görüntüsü
Sobel – Feldman operatöründen normalleştirilmiş gradyan büyüklüğü
Normalleştirilmiş xSobel – Feldman operatöründen gradyan
Normalleştirilmiş ySobel – Feldman operatöründen gradyan

Aşağıdaki resimler, gri tonlamalı bir daire üzerindeki gradyan yönündeki değişikliği göstermektedir. İşareti ne zaman ve aynıdır, gradyanın açısı pozitiftir ve farklı olduğunda negatiftir. Aşağıdaki örnekte, dairenin kenarındaki kırmızı ve sarı renkler pozitif açıları, mavi ve camgöbeği renkleri negatif açıları belirtir. Dairenin sol ve sağ taraflarındaki dikey kenarların açısı 0'dır çünkü . Çemberin üst ve alt kenarlarındaki yatay kenarların açıları -π/2 ve π/2 sırasıyla yerel bir değişiklik olmadığı için . Üst kenar için negatif açı, geçişin parlaktan koyu bölgeye olduğunu belirtir ve alt kenar için pozitif açı, karanlıktan parlak bölgeye geçişi belirtir. Her ikisinde de yerel değişiklik olmadığı için diğer tüm pikseller siyah olarak işaretlenmiştir. veya ve dolayısıyla açı tanımlanmamıştır. Açı oranının bir fonksiyonu olduğu için -e küçük değişim oranlarına sahip pikseller yine de büyük bir açılı tepkiye sahip olabilir. Sonuç olarak, gürültü tipik olarak istenmeyen bir geniş açılı tepkiye sahip olabilir. Görüntü işleme uygulamaları için gradyan açısı bilgilerini kullanırken, kaldırmak için çaba gösterilmelidir. görüntü gürültüsü bu yanlış yanıtı azaltmak için.

Beyaz arka plana sahip siyah bir dairenin gri tonlamalı görüntüsü.
Sobel operatörünün gradyanının yönü.

Alternatif operatörler

Sobel-Feldman operatörü, saf merkezi farklar operatörü ile ilişkili artefaktları azaltırken, mükemmel dönüş simetrisine sahip değildir. Scharr bu mülkü optimize etme konusuna baktı.[4][5] Burada 5 x 5 boyutuna kadar filtre çekirdekleri sunulmuştur, ancak en sık kullanılanı:

Bu faktörler benzer şekilde:

Scharr operatörleri Fourier alanında ağırlıklı ortalama kare açısal hatayı en aza indiren bir optimizasyonun sonucudur. Bu optimizasyon, elde edilen filtrelerin sayısal olarak tutarlı olması koşuluyla yapılır. Bu nedenle, sadece simetri kısıtlamalarını korumaktan çok türev çekirdeklerdir. Scharr'ın teorisinden kaynaklanan optimum 8 bit tam sayı değerli 3x3 filtre

Benzer bir optimizasyon stratejisi ve ortaya çıkan filtreler de Farid ve Simoncelli tarafından sunuldu.[6][7] Ayrıca yüksek mertebeden türev şemalarını da araştırırlar. Scharr'ın çalışmasının aksine, bu filtreler sayısal olarak tutarlı olmaya zorlanmaz.

Türev filtre tasarımı sorunu yeniden ele alındı, ör. Kroon tarafından.[8]

Rasgele kübik eğriye dayalı türev filtreleri Hast tarafından sunuldu.[9] Birinci ve ikinci dereceden türevlerin, 7 uzunluğunda filtreler veren çift filtreleme yaklaşımıyla kübik veya trigonometrik eğriler kullanılarak nasıl doğru şekilde hesaplanabileceğini gösterdi.

Orijinal olarak Sobel operatöründen üretilen bir diğer benzer operatör Kayyalı operatörüdür,[10] mükemmel bir rotasyonel simetri tabanlı evrişim filtresi 3x3.

Oryantasyon-optimal türev çekirdekleri, optik akış tahminindeki sistematik tahmin hatalarını büyük ölçüde azaltır. Daha da yüksek doğruluk ve genişletilmiş optik akış tahmini için optimize edilmiş filtre ailelerine sahip daha büyük şemalar, Scharr tarafından sonraki çalışmalarda sunulmuştur.[11] Şeffaf hareket kestirimi için ikinci dereceden türev filtre setleri incelenmiştir.[12] Ortaya çıkan çekirdekler ne kadar büyükse, Gauss filtrelerinin Türevine o kadar iyi yaklaştıkları görülmüştür.

Örnek karşılaştırmalar

Burada, test görüntüsünün gradyan büyüklüğünü tahmin etmek için dört farklı gradyan operatörü kullanılır.

Tuğla duvar ve bisiklet askısının gri tonlamalı test görüntüsü
Sobel – Feldman operatöründen gradyan büyüklüğü
Scharr operatöründen gradyan büyüklüğü
Gradyan büyüklüğü Roberts Cross Şebeke
Gradyan büyüklüğü Prewitt operatörü

Sözde kod uygulaması

işleviSobel(A: iki boyutlu görüntü dizisi olarak)	Gx = [-1 0 1; -2 0 2; -1 0 1]	Gy = [-1 -2 -1; 0 0 0; 1 2 1]		satırlar = boyut(Bir, 1)	sütunlar = boyut(Bir, 2)	mag = sıfırlar(Bir)için i = 1: satırlar-2için j = 1: sütunlar-2			S1 = toplam(toplam(Gx.*Bir(ben:ben+2,j:j+2)))			S2 = toplam(toplam(Gy.*Bir(ben:ben+2,j:j+2)))			mag(ben+1, j+1) = sqrt(S1.^2+S2.^2)son içinson için		eşik = 70 % uygulama için değişiklik gösterir [0 255]	output_image = max(mag, eşik)	output_image(output_image == yuvarlak(eşik)) = 0;dönüş output_imageson işlevi

Ayrıca bakınız

Referanslar

  1. ^ Irwin Sobel, 2014, Sobel Operatörünün Tarihçesi ve Tanımı
  2. ^ Özellik Dedektörleri - Sobel Kenar Dedektörü
  3. ^ K. Engel (2006). Gerçek zamanlı hacim grafikleri. s. 112–114.
  4. ^ Scharr, Hanno, 2000, Tez (Almanca), Dijital Görüntü İşlemede Optimal Operatörler.
  5. ^ B. Jähne, H. Scharr ve S. Körkel. Filtre tasarımının ilkeleri. Bilgisayarla Görme ve Uygulamalar El Kitabında. Academic Press, 1999.
  6. ^ H. Farid ve E. P. Simoncelli, Optimal Dönme Eşdeğeri Yönlü Türev Çekirdekler, Int'l Conf Computer Analysis of Images and Patterns, s. 207–214, Eylül 1997.
  7. ^ H. Farid ve E. P. Simoncelli, Ayrık çok boyutlu sinyallerin farklılaşması, IEEE Trans Image Processing, cilt 13 (4), s. 496–508, Nisan 2004.
  8. ^ D. Kroon, 2009, Kısa Makale Twente Üniversitesi, Çekirdek Tabanlı Görüntü Türevlerinin Sayısal Optimizasyonu.
  9. ^ A. Hast., "Çift filtreleme yaklaşımıyla birinci ve ikinci dereceden türevler için basit filtre tasarımı", Örüntü Tanıma Mektupları, Cilt. 42, no. 1 Haziran, s. 65–71. 2014.
  10. ^ Dim, Jules R .; Takamura, Tamio (2013-12-11). "Uydu Bulutu Sınıflandırması için Alternatif Yaklaşım: Edge Gradient Uygulaması". Meteorolojideki Gelişmeler. 2013: 1–8. doi:10.1155/2013/584816. ISSN  1687-9309.
  11. ^ Scharr Hanno (2007). "Genişletilmiş Optik Akış için Optimum Filtreler". Karmaşık Hareket. Bilgisayar Bilimlerinde Ders Notları. 3417. Berlin, Heidelberg: Springer Berlin Heidelberg. sayfa 14–29. doi:10.1007/978-3-540-69866-1_2. ISBN  978-3-540-69864-7.
  12. ^ Scharr, Hanno, ŞEFFAF HAREKET TAHMİNİ İÇİN OPTİMAL İKİNCİ SİPARİŞ TÜREV FİLTRE AİLELERİ 15. Avrupa Sinyal İşleme Konferansı (EUSIPCO 2007), Poznan, Polonya, 3–7 Eylül 2007.

Dış bağlantılar