Otomatik görüntü açıklama - Automatic image annotation

Otomatik görüntü açıklama (Ayrıca şöyle bilinir otomatik resim etiketleme veya dilbilimsel indeksleme) bir bilgisayar sisteminin otomatik olarak atadığı süreçtir. meta veriler şeklinde altyazı ekleme veya anahtar kelimeler bir Dijital görüntü. Bu uygulama Bilgisayar görüşü kullanılan teknikler görüntü alma ilgilendiğiniz görüntüleri düzenlemek ve bulmak için sistemler veri tabanı.

Bu yöntem, bir tür çok sınıflı görüntü sınıflandırması çok sayıda sınıfla - kelime bilgisi boyutu kadar büyük. Tipik, görüntü analizi çıkarılan şeklinde özellik vektörleri ve eğitim ek açıklama kelimeleri tarafından kullanılır makine öğrenme ek açıklamaları yeni görüntülere otomatik olarak uygulamaya çalışma teknikleri. İlk yöntemler arasındaki korelasyonları öğrendi görüntü özellikleri ve eğitim notları, ardından teknikler geliştirildi makine çevirisi metinsel kelime dağarcığını 'görsel kelime dağarcığı' veya olarak bilinen kümelenmiş bölgelerle çevirmeye çalışmak lekeler. Bu çabaları izleyen çalışmalar, sınıflandırma yaklaşımlarını, uygunluk modellerini vb. İçermektedir.

Otomatik görüntü açıklamasının avantajları içerik tabanlı görüntü alma (CBIR), sorguların kullanıcı tarafından daha doğal olarak belirlenebilmesidir.[1] CBIR genellikle (şu anda) kullanıcıların renk ve renk gibi görüntü kavramlarına göre arama yapmasını gerektirir. doku veya örnek sorgular bulma. Örnek görüntülerdeki bazı görüntü özellikleri, kullanıcının gerçekten odaklandığı kavramı geçersiz kılabilir. Kütüphaneler tarafından kullanılanlar gibi geleneksel görüntü alma yöntemleri, özellikle var olan büyük ve sürekli büyüyen görüntü veri tabanları göz önüne alındığında, pahalı ve zaman alıcı olan manuel olarak açıklamalı görüntülere dayanmaktadır.

Otomatik Görüntü Ek Açıklama Yazılımı

SuperAnnotate

SuperAnnotate için uçtan uca bir platformdur Bilgisayar görüşü mühendisler ve açıklama ekipleri, bilgisayarla görme ardışık düzenlerine açıklama eklemek, yönetmek, eğitmek ve nihayetinde otomatikleştirmek için.

Otomasyon: Platform, hem etiketlemede hem de etiketlemede üç farklı otomasyon türü sağlar. kalite güvencesi seviyeleri. Otomasyon aracılığıyla yapılabilir transfer öğrenimi, aktif öğrenme[2] ve yanlış etiket tespiti.[3] Veri açıklama projeleri arasında kurulan bağlantı aracılığıyla ve Sinir ağı bir kişi, hepsi aynı platform içinde özel modeller eğitme, manuel düzeltmeler yapma ve yineleme kapasitesine sahiptir ve sonuç olarak her yeni açıklama görevinin hızını ve doğruluğunu arttırır. Platform ayrıca, sınırlı veri kümesiyle en yüksek tanıma doğruluğuna ulaşmanıza yardımcı olacak geniş görüntü kümesinden en uygun kareleri seçmenize olanak tanır. Ek açıklama otomasyonunun kendisinin yanı sıra SuperAnnotate, yanlış etiketlenmiş eğitim örneklerinin algılanmasını otomatikleştirerek veri gürültüsünün ortadan kaldırılmasına izin verir. Platform, tüm veri açıklama ardışık düzenini birleştirmek ve otomatikleştirmek için özel olarak oluşturulmuştur.

API Entegrasyonları: Platform, daha büyük projeler için proje kurulumunu ve dağıtımını, ekip yönetimini ve ölçeklendirmeyi otomatikleştiren yerleşik bir Python SDK ile birlikte gelir. SDK, çeşitli veri aktarım işlevleri, açıklama dönüştürücüler, görüntülerin veri işleme işlevlerini, açıklamaları vb. İçerir.[4] Ayrıca CV mühendislerinin eğitim yürütmesine, birden fazla eğitim sonucunu karşılaştırmasına, riskli ek açıklamaları otomatik olarak bulmasına vb. Olanak tanır.[5]

Ayrıca bakınız

Referanslar

  1. ^ [1]
  2. ^ SuperAnnotate (2020-09-30), AnnotationSoftware / active_learning, alındı 2020-11-17
  3. ^ SuperAnnotate (2020-09-17), Yazılım / qa-otomasyon, alındı 2020-11-17
  4. ^ SuperAnnotate (2020-09-17), Ek açıklamaYazılım / superannotate-python-sdk, alındı 2020-11-17
  5. ^ "SuperAnnotate Masaüstü". opencv.org. Alındı 2020-11-17.

daha fazla okuma

  • Kelime birlikte oluşum modeli
Y Mori; H Takahashi ve R Oka (1999). "Görüntüden kelimeye dönüştürme, görüntüleri sözcüklerle bölmeye ve vektör nicelemesine dayanır.". Uluslararası Multimedya Akıllı Depolama ve Erişim Yönetimi Çalıştayı Bildirileri. CiteSeerX  10.1.1.31.1704.
  • Makine çevirisi olarak ek açıklama
P Duygulu; K Barnard; N de Fretias ve D Forsyth (2002). "Makine çevirisi olarak nesne tanıma: Sabit bir resim sözlüğü için bir sözlüğü öğrenme". Avrupa Bilgisayarla Görü Konferansı Bildirileri. s. 97–112. Arşivlenen orijinal 2005-03-05 tarihinde.
  • İstatistiksel modeller
J Li ve J Z Wang (2006). "Resimlerin Gerçek Zamanlı Bilgisayarlı Ek Açıklamaları". Proc. ACM Multimedya. s. 911–920.
J Z Wang ve J Li (2002). "2 Boyutlu MHMM'lerle Resimlerin Öğrenmeye Dayalı Dilbilimsel İndekslenmesi". Proc. ACM Multimedya. sayfa 436–445.
  • Resimlerin otomatik dilsel indekslenmesi
J Li ve J Z Wang (2008). "Resimlerin Gerçek Zamanlı Bilgisayarlı Ek Açıklamaları". Örüntü Analizi ve Makine Zekası Üzerine IEEE İşlemleri.
J Li ve J Z Wang (2003). "İstatistiksel Modelleme Yaklaşımı ile Resimlerin Otomatik Dilsel İndekslenmesi". Örüntü Analizi ve Makine Zekası Üzerine IEEE İşlemleri. s. 1075–1088.
  • Hiyerarşik Açı Küme Modeli
K Barnard; D Bir Forsyth (2001). "Kelimelerin ve Resimlerin Anlamsallığını Öğrenmek". Uluslararası Bilgisayarlı Görü Konferansı Bildirileri. sayfa 408–415. Arşivlenen orijinal 2007-09-28 tarihinde.
  • Gizli Dirichlet Tahsis modeli
D Blei; A Ng & M Jordan (2003). "Gizli Dirichlet tahsisi" (PDF). Makine Öğrenimi Araştırmaları Dergisi. s. 3: 993–1022. Arşivlenen orijinal (PDF) 2005-05-21 tarihinde.
G Carneiro; A B Chan; P Moreno ve N Vasconcelos (2006). "Görüntü Açıklama ve Erişim için Anlamsal Sınıfların Denetimli Öğrenimi" (PDF). Örüntü Analizi ve Makine Zekası Üzerine IEEE İşlemleri. s. 394–410.
  • Doku benzerliği
RW Picard ve T P Minka (1995). "Ek Açıklama İçin Görüş Dokusu". Multimedya Sistemleri.
  • Vektör makineleri desteklemek
C Cusano; G Ciocca & R Scettini (2004). "SVM Kullanarak Resim Açıklama". İnternet Görüntüleme IV Bildirileri. İnternet Görüntüleme V. 5304. s. 330. Bibcode:2003SPIE.5304..330C. doi:10.1117/12.526746.
  • Karar Ağaçları ve Rastgele Alt Pencereler Topluluğu
R Maree; P Geurts; J Piater ve L Wehenkel (2005). "Sağlam Görüntü Sınıflandırması için Rastgele Alt Pencereler". IEEE Uluslararası Bilgisayarlı Görü ve Örüntü Tanıma Konferansı Bildirileri. sayfa 1: 34–30.
  • Maksimum Entropi
J Jeon; R Manmatha (2004). "Otomatik Görüntü Ek Açıklama için Maksimum Entropi Kullanma" (PDF). Görüntü ve Video Erişiminde Uluslararası Konf. (CIVR 2004). s. 24–32.
  • Alaka modelleri
J Jeon; V Lavrenko & R Manmatha (2003). "Çapraz medya alaka modellerini kullanarak otomatik resim açıklama ve alma" (PDF). Bilgi Erişimde Araştırma ve Geliştirme ACM SİGİR Konferansı Bildirileri. s. 119–126.
  • Sürekli olasılık yoğunluk fonksiyonlarını kullanan alaka modelleri
V Lavrenko; R Manmatha ve J Jeon (2003). "Resimlerin anlambilimini öğrenmek için bir model" (PDF). 16. Sinirsel Bilgi İşleme Sistemlerinde Gelişmeler Konferansı Bildirileri NIPS.
  • Tutarlı Dil Modeli
R Jin; J Y Chai; L Si (2004). "Tutarlı Bir Dil Modeli ve Aktif Öğrenme Yoluyla Etkili Otomatik Resim Ek Açıklaması" (PDF). MM'04 Bildirileri.
  • Çıkarım ağları
D Metzler ve R Manmatha (2004). "Görüntü almaya çıkarım ağı yaklaşımı" (PDF). Uluslararası Görüntü ve Video Erişimi Konferansı Bildirileri. s. 42–50.
  • Çoklu Bernoulli dağılımı
S Feng; R Manmatha ve V Lavrenko (2004). "Görüntü ve video ek açıklaması için birden çok Bernoulli alaka düzeyi modeli" (PDF). Bilgisayarlı Görü ve Örüntü Tanıma IEEE Konferansı. s. 1002–1009.
  • Çoklu tasarım alternatifleri
J Y Pan; H-J Yang; P Duygulu; C Faloutsos (2004). "Otomatik Resim Yazısı" (PDF). 2004 IEEE Uluslararası Multimedya ve Expo Konferansı (ICME'04) Bildirileri. Arşivlenen orijinal (PDF) 2004-12-09 tarihinde.
  • Doğal sahne açıklaması
J Fan; Y Gao; H Luo; G Xu (2004). "Görüntü İçeriği Temsili için Kavrama Duyarlı Göze Çarpan Nesneleri Kullanarak Otomatik Görüntü Ek Açıklama". Bilgi erişiminde araştırma ve geliştirme üzerine 27. yıllık uluslararası konferansın bildirileri. sayfa 361–368.
  • Alakalı düşük seviyeli global filtreler
Bir Oliva ve Bir Torralba (2001). "Sahnenin şeklini modellemek: uzaysal zarfın bütünsel bir temsili" (PDF). International Journal of Computer Vision. sayfa 42: 145–175.
  • Global görüntü özellikleri ve parametrik olmayan yoğunluk tahmini
A Yavlinsky, E Schofield ve S Rüger (2005). "Global Özellikler ve Güçlü Parametrik Olmayan Yoğunluk Tahmini Kullanan Otomatik Resim Ek Açıklama" (PDF). Görüntü ve Video Erişiminde Uluslararası Konf. (CIVR, Singapur, Temmuz 2005). Arşivlenen orijinal (PDF) 2005-12-20 tarihinde.
  • Video semantiği
N Vasconcelos ve Bir Lippman (2001). "İçerik Analizi ve Karakterizasyon için Video Yapısının İstatistiksel Modelleri" (PDF). Görüntü İşlemede IEEE İşlemleri. s. 1–17.
Ilaria Bartolini; Marco Patella ve Corrado Romani (2010). "Shiatsu: Kesmeler Kullanarak Videoların Segmentasyona Göre Anlamsal Tabanlı Hiyerarşik Otomatik Etiketlenmesi". 3. ACM Uluslararası Medya Üretiminde Otomatik Bilgi Çıkarma Çalıştayı (AIEMPro10).
  • Görüntü Ek Açıklama İyileştirme
Yohan Jin; Latifur Han; Lei Wang ve Mamoun Awad (2005). "Birden çok kanıtı ve wordNet'i birleştirerek resim açıklamaları". 13. Yıllık ACM Uluslararası Multimedya Konferansı (MM 05). s. 706–715.
Changhu Wang; Feng Jing; Lei Zhang ve Hong-Jiang Zhang (2006). "Yeniden başlatmalarla rastgele yürüyüş kullanarak resim ek açıklamasını iyileştirme". 14. Yıllık ACM Uluslararası Multimedya Konferansı (MM 06).
Changhu Wang; Feng Jing; Lei Zhang ve Hong-Jiang Zhang (2007). "içerik tabanlı resim ek açıklama iyileştirme". Bilgisayarla Görme ve Örüntü Tanıma IEEE Konferansı (CVPR 07). doi:10.1109 / CVPR.2007.383221.
Ilaria Bartolini ve Paolo Ciaccia (2007). "Hayal Gücü: Doğru Görüntü Ek Açıklamaları İçin Bağlantı Analizinden Yararlanma". Springer Uyarlanabilir Multimedya Erişimi. doi:10.1007/978-3-540-79860-6_3.
Ilaria Bartolini ve Paolo Ciaccia (2010). "Çok Boyutlu Anahtar Kelime Tabanlı Resim Açıklama ve Arama". 2. ACM Uluslararası Yapılandırılmış Veriler Üzerinde Anahtar Kelime Arama Çalıştayı (KEYS 2010).
  • Görsel Tanımlayıcılar Topluluğu ile Otomatik Görüntü Ek Açıklama
Emre Akbaş ve Fatos Y. Vural (2007). "Görsel Tanımlayıcılar Topluluğu ile Otomatik Resim Ek Açıklama". Intl. Conf. Bilgisayar Görüsü (CVPR) 2007, Multimedyada Anlamsal Öğrenme Uygulamaları Çalıştayı. doi:10.1109 / CVPR.2007.383484.
  • Resim Ek Açıklamaları İçin Yeni Bir Temel
Ameesh Makadia ve Vladimir Pavlovic ve Sanjiv Kumar (2008). "Resim Ek Açıklaması için Yeni Bir Temel" (PDF). Avrupa Bilgisayarla Görü Konferansı (ECCV).

Eşzamanlı Görüntü Sınıflandırma ve Ek Açıklama

Chong Wang ve David Blei ve Li Fei-Fei (2009). "Eşzamanlı Görüntü Sınıflandırma ve Ek Açıklama" (PDF). Conf. Bilgisayarla Görme ve Örüntü Tanıma (CVPR) üzerine.
  • TagProp: Otomatik Görüntü Ek Açıklama İçin En Yakın Komşu Modellerde Ayrımcı Metrik Öğrenme
Matthieu Guillaumin ve Thomas Mensink ve Jakob Verbeek ve Cordelia Schmid (2009). "TagProp: Otomatik Görüntü Ek Açıklama İçin En Yakın Komşu Modellerde Ayrımcı Metrik Öğrenme" (PDF). Intl. Conf. Bilgisayarla Görme (ICCV) hakkında.
  • Anlamsal Mahallelerde Metrik Öğrenmeyi Kullanan Görüntü Açıklamaları
Yashaswi Verma ve C.V. Jawahar (2012). "Anlamsal Mahallelerde Metrik Öğrenmeyi Kullanan Resim Açıklaması" (PDF). Avrupa Bilgisayarla Görü Konferansı (ECCV). Arşivlenen orijinal (PDF) 2013-05-14 tarihinde. Alındı 2014-02-26.
  • Derin Öğrenme Temsillerini Kullanan Otomatik Görüntü Açıklama
Venkatesh N. Murthy & Subhransu Maji ve R. Manmatha (2015). "Derin Öğrenme Temsillerini Kullanarak Otomatik Resim Ek Açıklama" (PDF). Uluslararası Multimedya Konferansı (ICMR).
  • Bayes ağlarını ve aktif öğrenmeyi kullanarak Tıbbi Görüntü Açıklama
N. B. Marvasti & E. Yörük ve B. Acar (2018). "Bilgisayar Destekli Tıbbi Görüntü Ek Açıklaması: BT'de Karaciğer Lezyonları İle İlgili Ön Sonuçlar". IEEE Biyomedikal ve Sağlık Bilişimi Dergisi.