Faktör kodu - Factorial code

Gerçek dünya veri kümelerinin çoğu, tek tek bileşenleri olmayan veri vektörlerinden oluşur. istatistiksel olarak bağımsız. Diğer bir deyişle, bir elemanın değerinin bilinmesi, veri vektöründeki elemanların değeri hakkında bilgi sağlayacaktır. Bu meydana geldiğinde, bir faktör kodu verilerin, i. e., yeni bir vektör değerli temsil elde edilen kod vektörü tarafından benzersiz bir şekilde kodlanacak şekilde (kayıpsız kodlama), ancak kod bileşenleri istatistiksel olarak bağımsızdır.

Sonra denetimli öğrenme ham girdi verileri ilk olarak böyle bir faktör koduna çevrildiğinde genellikle çok daha iyi çalışır. Örneğin, nihai amacın görüntüleri yüksek oranda gereksiz piksellerle sınıflandırmak olduğunu varsayalım. Bir naif Bayes sınıflandırıcı piksellerin istatistiksel olarak bağımsız rastgele değişkenler ve bu nedenle iyi sonuçlar üretmede başarısız olur. Veriler ilk olarak faktöryel bir şekilde kodlanırsa, o zaman saf Bayes sınıflandırıcı, en uygun performans (Schmidhuber ve diğerleri 1996 ile karşılaştırın).

Faktörel kodlar oluşturmak için, Horace Barlow ve meslektaşları toplamı en aza indirmeyi önerdiler bit kod bileşenlerinin entropileri ikili kodlar (1989). Jürgen Schmidhuber (1992) problemi yordayıcılar ve ikili değişkenler açısından yeniden formüle etti özellik dedektörler, her biri ham verileri girdi olarak alıyor. Her dedektör için, diğer dedektörleri gören ve çeşitli giriş vektörlerine veya görüntülerine yanıt olarak kendi dedektörünün çıktısını tahmin etmeyi öğrenen bir tahminci vardır. Ancak her dedektör bir makine öğrenme mümkün olduğunca öngörülemez hale getirmek için algoritma. küresel optimum bunun amaç fonksiyonu özellik dedektörlerinin çıktıları arasında dağıtılmış bir şekilde temsil edilen bir faktöriyel koda karşılık gelir.

Painsky, Rosset ve Feder (2016, 2017) bu sorunu, bağımsız bileşen analizi sonlu alfabe boyutları üzerinden. Bir dizi teorem aracılığıyla, faktöriyel kodlama probleminin bir dal ve bağlı arama ağacı algoritması ile doğru bir şekilde çözülebileceğini veya bir dizi doğrusal problemle sıkı bir şekilde yaklaştırılabileceğini gösterdiler. Ek olarak, optimal çözüm için açgözlü ancak çok etkili bir yaklaşım sağlayan basit bir dönüşüm (yani sıra permütasyonu) sunarlar. Pratik olarak, dikkatli bir uygulama ile sıra permütasyonunun uygun özelliklerinin asimptotik olarak optimal bir hesaplama karmaşıklığında elde edilebileceğini gösterirler. Daha da önemlisi, teorik garantiler sağlarlar ve her rastgele vektörün bağımsız bileşenlere verimli bir şekilde ayrıştırılamayacağını, boyut arttıkça vektörlerin çoğunun çok iyi ayrıştığını (yani küçük bir sabit maliyetle) gösterirler. Ek olarak, çoklu kurulumlarda (2017) faktöriyel kodların veri sıkıştırmada kullanımını gösterirler.

Ayrıca bakınız

Referanslar

  • Horace Barlow, T. P. Kaushal ve G. J. Mitchison. Minimum entropi kodlarını bulmak. Nöral Hesaplama, 1: 412-423, 1989.
  • Jürgen Schmidhuber. Öngörülebilirlik minimizasyonu ile faktör kodlarını öğrenme. Nöral Hesaplama, 4 (6): 863-879, 1992
  • J. Schmidhuber ve M. Eldracher ve B. Foltin. Yarı doğrusal öngörülebilirlik minimizasyonu, iyi bilinen özellik dedektörleri üretir. Nöral Hesaplama, 8 (4): 773-786, 1996
  • A. Painsky, S. Rosset ve M. Feder. Sonlu alfabeler üzerinden genelleştirilmiş bağımsız bileşen analizi. Bilgi Teorisi IEEE İşlemleri, 62 (2): 1038-1053, 2016
  • A. Painsky, S. Rosset ve M. Feder. Bağımsız Bileşen Analizi kullanarak Büyük Alfabe Kaynak Kodlaması. Bilgi Teorisi IEEE İşlemleri, 63 (10): 6514 - 6529, 2017