Muhtemelen yaklaşık olarak doğru öğrenme - Probably approximately correct learning

İçinde hesaplamalı öğrenme teorisi, muhtemelen yaklaşık olarak doğru (PAC) öğrenme matematiksel analizi için bir çerçevedir makine öğrenme. 1984 yılında Leslie Valiant.[1]

Bu çerçevede, öğrenci örnekleri alır ve bir genelleme işlevi seçmelidir ( hipotez) belirli bir olası işlev sınıfından. Amaç, yüksek olasılıkla ("muhtemelen" kısmı), seçilen işlevin düşük genelleme hatası ("yaklaşık olarak doğru" kısım). Öğrenci, herhangi bir keyfi yaklaşım oranı, başarı olasılığı veya numunelerin dağılımı.

Model daha sonra gürültüyü (yanlış sınıflandırılmış örnekler) tedavi etmek için genişletildi.

PAC çerçevesinin önemli bir yeniliği, hesaplama karmaşıklığı teorisi makine öğrenimi kavramları. Özellikle, öğrencinin verimli işlevler bulması beklenir (zaman ve mekan gereksinimleri bir polinom ve öğrencinin kendisi verimli bir prosedür uygulamalıdır (kavram boyutunun bir polinomuna sınırlanmış bir örnek sayım gerektirir, yaklaşıklık ve olasılık sınırlar).

Tanımlar ve terminoloji

PAC ile öğrenilebilen bir şeyin tanımını vermek için, önce bazı terminoloji sunmalıyız.[2][3]

Aşağıdaki tanımlar için iki örnek kullanılacaktır. Birincisi problemi karakter tanıma bir dizi verildiğinde ikili değerli bir görüntüyü kodlayan bitler. Diğer örnek, aralık içindeki noktaları pozitif olarak ve aralığın dışındaki noktaları negatif olarak doğru şekilde sınıflandıracak bir aralık bulma sorunudur.

İzin Vermek denen bir set olmak örnek alanı veya tüm örneklerin kodlanması. Karakter tanıma probleminde, örnek alanı . Aralık probleminde örnek uzay, , içindeki tüm sınırlı aralıkların kümesidir , nerede tüm gerçek sayılar kümesini gösterir.

Bir konsept bir alt kümedir . Bir kavram, tüm bit modellerinin kümesidir. "P" harfinin bir resmini kodlar. İkinci örnekten örnek bir kavram, açık aralıklar kümesidir, her biri yalnızca olumlu noktaları içerir. Bir konsept sınıfı kavramların bir koleksiyonudur . Bu, bit dizisinin tüm alt kümelerinin kümesi olabilir. iskeletleştirilmiş 4 bağlantılı (yazı tipi genişliği 1'dir).

İzin Vermek örnek oluşturan bir prosedür olmak, , bir olasılık dağılımı kullanarak ve doğru etiketi verir , bu 1 ise ve 0 aksi takdirde.

Şimdi verildi bir algoritma olduğunu varsayalım ve bir polinom içinde (ve sınıfın diğer ilgili parametreleri ) öyle ki, bir boyut örneği verildiğinde göre çizilmiş en azından olasılıkla , bir hipotez çıkarır daha küçük veya eşit ortalama hatası olan açık aynı dağıtımla . Ayrıca, algoritma için yukarıdaki ifade her konsept için doğrudur ve her dağıtım için bitmiş ve herkes için sonra (verimli) PAC öğrenilebilir (veya dağıtım gerektirmeyen PAC öğrenilebilir). Bunu da söyleyebiliriz bir PAC öğrenme algoritması için .

Eşdeğerlik

Bazı düzenlilik koşulları altında bu koşullar eşdeğerdir: [4]

  1. Konsept sınıfı C PAC öğrenilebilir.
  2. VC boyutu nın-nin C sonludur.
  3. C üniforma Glivenko-Cantelli sınıfı.[açıklama gerekli ]
  4. C dır-dir sıkıştırılabilir Littlestone ve Warmuth anlamında

Ayrıca bakınız

Referanslar

  1. ^ L. Valiant. Öğrenilebilir bir teori. ACM'nin İletişimleri, 27, 1984.
  2. ^ Kearns ve Vazirani, sf. 1-12,
  3. ^ Balas Kausik Natarajan, Makine Öğrenimi, Teorik Bir Yaklaşım, Morgan Kaufmann Publishers, 1991
  4. ^ Blumer, Anselm; Ehrenfeucht, Andrzej; David, Haussler; Manfred, Warmuth (Ekim 1989). "Öğrenilebilirlik ve Vapnik-Chervonenkis Boyutu". Bilgisayar Makineleri Derneği Dergisi. 36 (4): 929–965. doi:10.1145/76359.76371. S2CID  1138467.

https://users.soe.ucsc.edu/~manfred/pubs/lrnk-olivier.pdf

Moran, Shay; Yehudayoff, Amir (2015). "VC sınıfları için örnek sıkıştırma şemaları". arXiv:1503.06960 [cs.LG ].

daha fazla okuma