Müzik bilgilerinin alınması - Music information retrieval

Müzik bilgilerinin alınması (MIR) disiplinler arası geri getirme bilimidir bilgi itibaren müzik. MIR, birçok gerçek dünya uygulamasıyla küçük ama büyüyen bir araştırma alanıdır. MIR ile ilgili olanların bir geçmişi olabilir müzikoloji, psikoakustik, Psikoloji akademik müzik çalışması, sinyal işleme, bilişim, makine öğrenme optik müzik tanıma, Sayısal zeka veya bunların bazı kombinasyonları.

Başvurular

MIR, işletmeler ve akademisyenler tarafından müziği kategorize etmek, manipüle etmek ve hatta yaratmak için kullanılıyor.

Öneri sistemleri

Birkaç tavsiye sistemleri müzik için zaten mevcut, ancak şaşırtıcı bir şekilde çok azı MIR tekniklerine dayanıyor, bunun yerine kullanıcılar arasındaki benzerlikten veya zahmetli veri derlemesinden yararlanıyor. Pandora örneğin, müziği "kadın şarkıcı" veya "güçlü bas" gibi belirli niteliklerle etiketlemek için uzmanlar kullanır. Diğer birçok sistem, dinleme geçmişi benzer olan kullanıcıları bulur ve kendi koleksiyonlarından kullanıcılara duyulmamış müzikler önerir. MIR teknikleri müzikte benzerlik artık bu tür sistemlerin bir parçasını oluşturmaya başlıyor.

Parça ayırma ve cihaz tanıma

Parça ayırma, her parça için birden fazla enstrümana sahip olabilecek orijinal parçaları kaydedildiği gibi çıkarmakla ilgilidir. Enstrüman tanıma, dahil olan enstrümanları tanımlamak ve / veya müziği enstrüman başına tek bir parçaya ayırmakla ilgilidir. Ana kopyaya erişim olmadan müziği bileşen parçalarına ayırabilen çeşitli programlar geliştirilmiştir. Bu şekilde ör. Karaoke parçaları normal müzik parçalarından oluşturulabilir, ancak vokallerin diğer enstrümanlarla aynı frekans alanını kaplaması nedeniyle süreç henüz mükemmel değildir.

Otomatik müzik transkripsiyonu

Otomatik müzik transkripsiyonu bir ses kaydını sembolik gösterime dönüştürme işlemidir, örneğin bir skor veya bir MIDI dosyası.[1] Bu süreç, çok aralıklı algılama dahil olmak üzere birkaç ses analizi görevini içerir. başlangıç ​​tespiti, süre tahmini, enstrüman tanımlama ve harmonik, ritmik veya melodik bilgilerin çıkarılması. Bu görev, daha fazla alet ve daha fazla aletle daha zor hale gelir. polifoni seviyesi.

Otomatik kategorizasyon

Müzik türü sınıflandırması, MIR için ortak bir görevdir ve yıllık Müzik Bilgi Erişim Değerlendirme eXchange (MIREX) için olağan görevdir.[2] Gibi makine öğrenimi teknikleri Vektör makineleri desteklemek sınıflandırmanın biraz öznel doğasına rağmen iyi performans gösterme eğilimindedir. Diğer potansiyel sınıflandırmalar, sanatçıyı, menşe yerini veya eserin ruh halini tanımlamayı içerir. Çıktının bir sınıftan ziyade bir sayı olmasının beklendiği durumlarda, regresyon analizi gereklidir.

Müzik üretimi

otomatik müzik üretimi birçok MIR araştırmacısı tarafından tutulan bir hedeftir. Sonuçların insan tarafından takdir edilmesi açısından sınırlı başarı ile girişimlerde bulunulmuştur.

Kullanılan yöntemler

Veri kaynağı

Skorlar Çalışılacak müziğin net ve mantıklı bir tanımını verin, ancak dijital veya başka türlü notalara erişim genellikle pratik değildir. MİDİ müzik de benzer nedenlerle kullanılmıştır, ancak müzik nadiren MIDI standartları dikkate alınarak yazılmadığı sürece, herhangi bir başka formattan MIDI'ye dönüştürme sırasında bazı veriler kaybolur. Gibi dijital ses formatları WAV, mp3, ve ogg sesin kendisi analizin parçası olduğunda kullanılır. Mp3 ve ogg gibi kayıplı formatlar insan kulağı ile iyi çalışır, ancak çalışma için çok önemli veriler eksik olabilir. Ek olarak bazı kodlamalar, herhangi bir otomatik analizör için yanıltıcı olabilecek eserler oluşturur. Buna rağmen mp3'ün her yerde bulunması, alandaki birçok araştırmanın bunları kaynak materyal olarak içerdiği anlamına geliyor. Giderek artan bir şekilde, web'den çıkarılan meta veriler, kültürel bağlamı içinde müziğin daha kapsamlı bir şekilde anlaşılması için MIR'a dahil edilmektedir ve bu, son zamanlarda sosyal etiketler müzik için.

Özellik gösterimi

Analiz genellikle biraz özetleme gerektirebilir,[3] ve müzik için (diğer birçok veri biçiminde olduğu gibi) bu, özellik çıkarma özellikle ses içeriğinin kendisi analiz edildiğinde ve makine öğrenimi uygulanacağı zaman. Amaç, öğrenmenin makul bir zaman çerçevesi içinde gerçekleştirilebilmesi için çok fazla veri miktarını yönetilebilir bir değerler kümesine düşürmektir. Çıkarılan ortak özelliklerden biri, Mel-Frekans Cepstral Katsayısı (MFCC) bir ölçüsü olan tını bir müzik parçası. Temsil etmek için diğer özellikler kullanılabilir. anahtar, akorlar, armoniler, melodi, ana Saha, dakika başına vuruş veya parçadaki ritim. Kullanılabilir bir dizi ses özelliği çıkarma aracı vardır[4] Burada mevcut

İstatistikler ve makine öğrenimi

  • Sınıflandırma, kümeleme ve modelleme için hesaplamalı yöntemler - mono ve polifonik müzik, benzerlik ve desen eşleştirme, alma
  • Biçimsel yöntemler ve veritabanları - otomatikleştirilmiş uygulamalar müzik kimliği ve tanınma gibi puan takibi müzik ve müzik sorguları için otomatik eşlik, yönlendirme ve filtreleme, sorgu dilleri, standartlar ve müzik bilgilerinin işlenmesi için diğer meta veriler veya protokoller ve geri alma, çok etmenli sistemler, dağıtılmış arama)
  • Müzik bilgilerinin alınması için yazılım - Anlamsal ağ müzikal dijital nesneler, akıllı aracılar, işbirliğine dayalı yazılım, web tabanlı arama ve anlamsal erişim, uğultu ile sorgulama / Sese göre ara, akustik parmak izi
  • Müzik analizi ve bilgi temsili - otomatik özetleme, alıntı yapma, alıntı yapma, sınıf düşürme, dönüştürme, resmi müzik modelleri, dijital notalar ve temsiller, müzik indeksleme ve meta veriler.

Diğer sorunlar

  • İnsan-bilgisayar etkileşimi ve arayüzleri - çok modlu arayüzler, Kullanıcı arayüzleri ve kullanılabilirlik, mobil uygulamalar, kullanıcı davranışı
  • Müzik algısı, biliş, etki ve duygular - müzik benzerlik ölçütleri sözdizimsel parametreler, anlamsal parametreler, müzikal formlar, yapılar, stiller ve müzik açıklama metodolojileri
  • Müzik arşivleri, kitaplıkları ve dijital koleksiyonlar - müzik dijital kitaplıklar, müzik arşivlerine, karşılaştırmalı değerlendirmelere ve araştırma veritabanlarına halka açık erişim
  • Fikri mülkiyet haklar ve müzik - ulusal ve uluslararası telif hakkı sorunlar, dijital haklar yönetimi, tanımlama ve izlenebilirlik
  • Müzik Sosyolojisi ve Ekonomisi - müzik endüstrisi ve MIR'ın üretim, dağıtım, tüketim zinciri, kullanıcı profili oluşturma, doğrulama, kullanıcı ihtiyaçları ve beklentileri, müzik IR sistemlerinin değerlendirilmesi, test koleksiyonları oluşturma, deneysel tasarım ve ölçümlerde kullanımı

Ayrıca bakınız

Referanslar

  1. ^ A. Klapuri ve M. Davy, editörler. Müzik Transkripsiyonu için Sinyal İşleme Yöntemleri. Springer-Verlag, New York, 2006.
  2. ^ http://www.music-ir.org/mirex/wiki/MIREX_HOME - Müzik Bilgi Alma Değerlendirme eXchange.
  3. ^ Eidenberger, Horst (2011). "Temel Medya Anlayışı", atpress. ISBN  978-3-8423-7917-6.
  4. ^ David Moffat, David Ronan ve Joshua D Reiss. "Ses Özelliği Çıkarma Araç Kutularının Değerlendirilmesi". Uluslararası Dijital Ses Efektleri Konferansı (DAFx) Bildirilerinde, 2016.

Dış bağlantılar

Örnek MIR uygulamaları