Atış geçiş tespiti - Shot transition detection

Atış geçiş tespiti (ya da sadece atış algılama) olarak da adlandırılır kesim tespiti araştırma alanı video işleme. Konusu, arasındaki geçişlerin otomatik olarak algılanmasıdır. atışlar içinde Dijital video videoların geçici olarak bölümlendirilmesi amacıyla.[1]

Kullanım

Çekim geçiş algılama, bir filmi, adı verilen temel zamansal birimlere ayırmak için kullanılır. atışlar; a atış tek bir kamera tarafından bitişik olarak çekilen ve zaman ve mekanda sürekli bir eylemi temsil eden birbiriyle ilişkili ardışık resimler dizisidir.[2]

Bu işlem, videoların post prodüksiyonu için yazılımda çok kullanışlıdır. Aynı zamanda, büyük video arşivlerine verimli bir erişim sağlayan otomatik indeksleme ve içerik tabanlı video alma veya özetleme uygulamalarının temel bir adımıdır, örn. bir uygulama, tüm filmin görsel bir özetini oluşturmak için her sahneden temsili bir resim seçebilir ve bu tür dizinleri işleyerek, bir arama motoru, "içinde aslan olan bir sahne olan tüm filmleri bana göster" gibi arama öğelerini işleyebilir.

Kesik algılama, bir insan düzenleyicinin manuel olarak yapamayacağı hiçbir şeyi yapamaz, ancak zaman kazandırdığı için avantajlıdır. Ayrıca dijital video kullanımının artması ve dolayısıyla yukarıda bahsedilen indeksleme uygulamalarının önemi nedeniyle otomatik kesim tespiti günümüzde çok önemlidir.

Temel teknik terimler

Bir Ani Geçiş.
eritmek şeffaflık efektiyle bir çekimi kademeli olarak diğeriyle karıştırır.

Basit bir ifadeyle, kesme algılama, bir sahnenin farklı görsel içeriğe sahip bir başkasıyla değiştirildiği bir videodaki konumları bulmakla ilgilidir. Teknik olarak aşağıdaki terimler kullanılır:

Bir dijital video şunlardan oluşur: çerçeveler hareket izlenimi yaratmak için izleyicinin gözüne hızlı bir şekilde sunulur. Bu bağlamda "Dijital", hem tek bir çerçevenin hem de piksel ve veriler şu şekilde mevcuttur: Ikili veri, bir bilgisayarla işlenebilecek şekilde. Dijital bir videodaki her kare, kendi özelliğiyle benzersiz şekilde tanımlanabilir. çerçeve dizini, bir seri numarası.

Bir atış tek bir kamera tarafından kesintisiz olarak çekilen kare dizisidir. Bir kaç tane var film geçişleri genellikle bitişik çekimleri yan yana koymak için film düzenlemede kullanılır; Atış geçiş tespiti bağlamında, bunlar genellikle iki türe ayrılırlar:[3]

  • Ani Geçişler - Bu, bir atıştan diğerine ani bir geçiş, i. e. bir kare ilk çekime, bir sonraki kare ikinci çekime aittir. Ayrıca sert kesimler veya basit kesimler olarak da bilinirler.
  • Kademeli Geçişler - Bu tür geçişlerde, iki çekim kromatik, uzamsal veya uzamsal-kromatik efektler kullanılarak birleştirilir ve bu efektler kademeli olarak bir çekimin yerini alır. Bunlar genellikle yumuşak geçişler olarak da bilinir ve çeşitli türlerde olabilir, örn. mendil, çözülür, kaybolur...

"Bir kesiğin algılanması", bir kesiğin pozisyonunun kazanıldığı anlamına gelir; daha kesin olarak sert kesim, "çerçeve i ile çerçeve i + 1 arasında sert kesim", yumuşak kesim ise "çerçeve i çerçevesinden j çerçevesine yumuşak kesim" olarak elde edilir.

Doğru algılanan bir geçişe vurmakvar olan ancak tespit edilmeyen bir kesiğe kaçırılan vuruş ve yazılımın bir kesimi üstlendiği, ancak gerçekte hiçbir kesimin olmadığı bir pozisyona yanlış vuruş.

Film düzenlemeye giriş ve kapsamlı bir çekim geçiş teknikleri listesi şu adreste bulunabilir: film düzenleme.

Sorunun büyüklüğü

Kesik algılama bir insan için basit bir görev gibi görünse de, bilgisayarlar için önemsiz olmayan bir görevdir. Bir videonun her karesi hakkında ek bilgilerle zenginleştirilmiş olsaydı, kesme algılama önemsiz bir sorun olurdu. ne zaman ve hangi kamerayla çekildi. Muhtemelen, kesme tespiti için hiçbir algoritma, güçlü bir yapay zeka ile sağlanmadıkça, tüm kesintileri kesin olarak tespit edemeyecektir.[kaynak belirtilmeli ]

Çoğu algoritma sert kesimlerle iyi sonuçlar elde ederken, çoğu yumuşak kesimleri tanımakta başarısız olur. Sert kesimler genellikle görsel içerikteki ani ve kapsamlı değişikliklerle birlikte olurken, yumuşak kesimler yavaş ve kademeli değişiklikler içerir. Bir insan, bir sahnenin anlamını anlayarak bu görsel çeşitlilik eksikliğini telafi edebilir. Bir bilgisayar bir kareyi silen siyah bir çizginin "devam eden sahnede yavaşça hareket eden başka bir normal nesne" olduğunu varsayarken, kişi sahnenin bittiğini ve yerini siyah bir ekran aldığını anlar.

Yöntemler

Kesik tespiti için her yöntem iki aşamalı bir ilkeye göre çalışır:

  1. Puanlama - Bir dijital videonun her bir ardışık karesi çiftine, aralarındaki benzerliği / farklılığı temsil eden belirli bir puan verilir.
  2. Karar - Daha önce hesaplanan tüm puanlar değerlendirilir ve puan yüksek kabul edilirse bir kesim tespit edilir.

Bu ilke hataya meyillidir. Birincisi, eşik değerinin küçük aşımları bile bir isabet ürettiği için, birinci aşamanın "kesilme" ve "kesilmeme" puanları arasındaki ortalama farkı maksimize etmek için değerleri geniş bir şekilde dağıtması sağlanmalıdır. İkincisi, eşik dikkatli seçilmelidir; genellikle istatistiksel yöntemlerle faydalı değerler elde edilebilir.

Kesim tespiti. (1) Hit: tespit edilen bir sert kesim. (2) Cevapsız isabet: yumuşak bir kesim (eritmek), bu tespit edilmedi. (3) Yanlış Vuruş: Yanlışlıkla iki farklı sert kesim olarak yorumlanan tek bir yumuşak kesim.

Puanlama

Görsel içerikteki farklılıklara erişmek için kullanılan birçok olası puan vardır; en yaygın olanlardan bazıları:

  • Mutlak farklılıkların toplamı (ÜZGÜN). Bu hem en bariz hem de en basit algoritmadır: Ardışık iki kare karşılaştırılır piksel piksel ile özetleyerek mutlak değerler karşılık gelen her iki pikselin farklılıkları. Sonuç, puan olarak kullanılan pozitif bir sayıdır. SAD, bir sahnedeki küçük değişikliklere bile çok hassas bir şekilde tepki verir: kameranın hızlı hareketleri, patlamalar veya önceden karanlık bir sahnede bir ışığın basit bir şekilde açılması yanlış vuruşlarla sonuçlanır. Öte yandan, SAD yumuşak kesimlere neredeyse hiç tepki vermez. Yine de, SAD, tüm görünür kesin kesintileri en yüksek olasılıkla tespit ettiğinden, genellikle temel bir "olası isabet" kümesi üretmek için kullanılır.
  • Histogram farklılıkları (HD). Histogram farklılıkları, Mutlak farkların toplamına çok benzer. Aradaki fark, HD'nin aşağıdakiler arasındaki farkı hesaplamasıdır. histogramlar ardışık iki çerçevenin; histogram, bir çerçeve içindeki her renk için o renkte gölgelenen piksellerin sayısını içeren bir tablodur. HD, bir sahnedeki küçük değişikliklere SAD kadar duyarlı değildir ve bu nedenle daha az yanlış vuruş üretir. HD'nin en büyük sorunlarından biri, gösterilen içerik son derece farklıyken iki görüntünün tam olarak aynı histogramlara sahip olabilmesidir, örn. g. bir deniz ve kumsal resmi, bir mısır tarlası ve gökyüzü ile aynı histograma sahip olabilir. HD, sert kesimleri tanıdığına dair hiçbir garanti vermez.
  • Kenar değişim oranı (ECR). ECR, iki çerçevenin gerçek içeriğini karşılaştırmaya çalışır. Her iki kareyi de kenar resimleri, ben. e. resimlerdeki nesnelerin olası ana hatlarını çıkarır (bkz. Kenar algılama detaylar için). Daha sonra bu kenar resimlerini kullanarak karşılaştırır. genişleme ikinci karenin birinci kare ile aynı nesneleri içermesi olasılığını hesaplamak için. ECR, puanlama için en iyi performans gösteren algoritmalardan biridir. Sert kesimlere çok hassas tepki verir ve doğası gereği birçok yumuşak kesimi tespit edebilir. Temel biçiminde ECR bile aşağıdaki gibi yumuşak kesimleri algılayamaz: mendil kaybolan nesneleri sahnede hareket eden normal nesneler olarak kabul ettiği için. Yine de, ECR, özel yumuşak kesim biçimlerini tanımak için manuel olarak genişletilebilir.

Son olarak, bu puanların iki veya daha fazlasının bir kombinasyonu performansı artırabilir.

Karar

Karar aşamasında genellikle aşağıdaki yaklaşımlar kullanılır:

  • Sabit Eşik - Bu yaklaşımda, puanlar önceden belirlenmiş bir eşikle karşılaştırılır ve puan eşikten yüksekse bir kesinti ilan edilir.
  • Uyarlanabilir Eşik - Bu yaklaşımda, puanlar, eşiği mevcut videonun özelliklerine uyarlamak için videodaki çeşitli puanları dikkate alan bir eşikle karşılaştırılır. Önceki durumda olduğu gibi, puan karşılık gelen eşikten yüksekse, bir kesinti ilan edilir.
  • Makine öğrenme - Makine öğrenimi teknikleri karar sürecine de uygulanabilir.

Maliyet

Yukarıdaki algoritmaların tümü O (n) 'de tamamlanır - yani doğrusal zamanda çalışırlar - burada n giriş videosundaki kare sayısıdır. Algoritmalar, çoğunlukla aşağıdakiler tarafından belirlenen sabit bir faktörde farklılık gösterir: görüntü çözünürlüğü videonun.

Kalite önlemleri

Bir kesim algılama algoritmasının kalitesini ölçmek için genellikle aşağıdaki üç önlem kullanılır:

  • Hatırlama mevcut bir kesintinin tespit edilme olasılığı:
  • Hassas varsayılan bir kesintinin aslında bir kesinti olma olasılığıdır:
  • F1 yalnızca ve ancak her iki hassasiyette yüksek değerle sonuçlanan birleşik bir ölçüdür ve hatırlama, yüksek değerlerle sonuçlanır:


Semboller şu anlama gelir: C, doğru algılanan kesim sayısı ("correct hits "), M, algılanmayan kesim sayısı ("missed isabetleri ") ve F, yanlış tespit edilen kesiklerin sayısı ("fBu ölçümlerin tümü matematiksel ölçümlerdir, yani 0 ile 1 arasında değerler verirler. Temel kural şudur: değer ne kadar yüksekse, algoritma o kadar iyi çalışır.

Referanslar

  1. ^ P. Balasubramaniam; R Uthayakumar (2 Mart 2012). Matematiksel Modelleme ve Bilimsel Hesaplama: Uluslararası Konferans, ICMMSC 2012, Gandhigram, Tamil Nadu, Hindistan, 16-18 Mart 2012. Springer. s. 421–. ISBN  978-3-642-28926-2.
  2. ^ Weiming Shen; Jianming Yong; Yun Yang (18 Aralık 2008). Tasarımda Bilgisayar Destekli Ortak Çalışma IV: 11. Uluslararası Konferans, CSCWD 2007, Melbourne, Avustralya, 26-28 Nisan 2007. Gözden Geçirilmiş Seçilmiş Makaleler. Springer Science & Business Media. s. 100–. ISBN  978-3-540-92718-1.
  3. ^ Joan Cabestany; Ignacio Rojas; Gonzalo Joya (30 Mayıs 2011). Hesaplamalı Zeka Gelişmeleri: 11. Uluslararası Yapay Sinir Ağları Çalışma Konferansı, IWANN 2011, Torremolinos-Málaga, İspanya, 8-10 Haziran 2011, Bildiriler. Springer Science & Business Media. s. 521–. ISBN  978-3-642-21500-1. Atış algılama, atış geçiş algılama algoritmaları aracılığıyla gerçekleştirilir. Bir videoyu çekimlere bölmek için iki farklı geçiş türü kullanılır: - Kesikler veya düz kesmeler olarak da adlandırılan ani geçişler, birinden ani bir değişiklik olduğunda meydana gelir ...