Muhtemelen yaklaşık olarak doğru öğrenme - Probably approximately correct learning

İçinde hesaplamalı öğrenme teorisi, muhtemelen yaklaşık olarak doğru (PAC) öğrenme matematiksel analizi için bir çerçevedir makine öğrenme. 1984 yılında Leslie Valiant.^[1]

Bu çerçevede, öğrenci örnekleri alır ve bir genelleme işlevi seçmelidir ( hipotez) belirli bir olası işlev sınıfından. Amaç, yüksek olasılıkla ("muhtemelen" kısmı), seçilen işlevin düşük genelleme hatası ("yaklaşık olarak doğru" kısım). Öğrenci, herhangi bir keyfi yaklaşım oranı, başarı olasılığı veya numunelerin dağılımı.

Model daha sonra gürültüyü (yanlış sınıflandırılmış örnekler) tedavi etmek için genişletildi.

PAC çerçevesinin önemli bir yeniliği, hesaplama karmaşıklığı teorisi makine öğrenimi kavramları. Özellikle, öğrencinin verimli işlevler bulması beklenir (zaman ve mekan gereksinimleri bir polinom ve öğrencinin kendisi verimli bir prosedür uygulamalıdır (kavram boyutunun bir polinomuna sınırlanmış bir örnek sayım gerektirir, yaklaşıklık ve olasılık sınırlar).

Tanımlar ve terminoloji

PAC ile öğrenilebilen bir şeyin tanımını vermek için, önce bazı terminoloji sunmalıyız.^[2]^[3]

Aşağıdaki tanımlar için iki örnek kullanılacaktır. Birincisi problemi karakter tanıma bir dizi verildiğinde ${ displaystyle n}$ ikili değerli bir görüntüyü kodlayan bitler. Diğer örnek, aralık içindeki noktaları pozitif olarak ve aralığın dışındaki noktaları negatif olarak doğru şekilde sınıflandıracak bir aralık bulma sorunudur.

İzin Vermek ${ displaystyle X}$ denen bir set olmak örnek alanı veya tüm örneklerin kodlanması. Karakter tanıma probleminde, örnek alanı ${ displaystyle X = {0,1 } ^ {n}}$ . Aralık probleminde örnek uzay, ${ displaystyle X}$ , içindeki tüm sınırlı aralıkların kümesidir ${ displaystyle mathbb {R}}$ , nerede ${ displaystyle mathbb {R}}$ tüm gerçek sayılar kümesini gösterir.

Bir konsept bir alt kümedir ${ displaystyle c alt küme X}$ . Bir kavram, tüm bit modellerinin kümesidir. ${ displaystyle X = {0,1 } ^ {n}}$ "P" harfinin bir resmini kodlar. İkinci örnekten örnek bir kavram, açık aralıklar kümesidir, ${ displaystyle {(a, b) orta 0 leq a leq pi / 2, pi leq b leq { sqrt {13}} }}$ her biri yalnızca olumlu noktaları içerir. Bir konsept sınıfı ${ displaystyle C}$ kavramların bir koleksiyonudur ${ displaystyle X}$ . Bu, bit dizisinin tüm alt kümelerinin kümesi olabilir. iskeletleştirilmiş 4 bağlantılı (yazı tipi genişliği 1'dir).

İzin Vermek ${ displaystyle EX (c, D)}$ örnek oluşturan bir prosedür olmak, ${ displaystyle x}$ , bir olasılık dağılımı kullanarak ${ displaystyle D}$ ve doğru etiketi verir ${ displaystyle c (x)}$ , bu 1 ise ${ displaystyle x in c}$ ve 0 aksi takdirde.

Şimdi verildi ${ displaystyle 0 < epsilon, delta <1}$ bir algoritma olduğunu varsayalım ${ displaystyle A}$ ve bir polinom ${ displaystyle p}$ içinde ${ displaystyle 1 / epsilon, 1 / delta}$ (ve sınıfın diğer ilgili parametreleri ${ displaystyle C}$ ) öyle ki, bir boyut örneği verildiğinde ${ displaystyle p}$ göre çizilmiş ${ displaystyle EX (c, D)}$ en azından olasılıkla ${ displaystyle 1- delta}$ , ${ displaystyle A}$ bir hipotez çıkarır ${ displaystyle h C}$ daha küçük veya eşit ortalama hatası olan ${ displaystyle epsilon}$ açık ${ displaystyle X}$ aynı dağıtımla ${ displaystyle D}$ . Ayrıca, algoritma için yukarıdaki ifade ${ displaystyle A}$ her konsept için doğrudur ${ displaystyle c in C}$ ve her dağıtım için ${ displaystyle D}$ bitmiş ${ displaystyle X}$ ve herkes için ${ displaystyle 0 < epsilon, delta <1}$ sonra ${ displaystyle C}$ (verimli) PAC öğrenilebilir (veya dağıtım gerektirmeyen PAC öğrenilebilir). Bunu da söyleyebiliriz ${ displaystyle A}$ bir PAC öğrenme algoritması için ${ displaystyle C}$ .

Eşdeğerlik

Bazı düzenlilik koşulları altında bu koşullar eşdeğerdir: ^[4]

Konsept sınıfı C PAC öğrenilebilir.
VC boyutu nın-nin C sonludur.
C üniforma Glivenko-Cantelli sınıfı.^{[açıklama gerekli ]}
C dır-dir sıkıştırılabilir Littlestone ve Warmuth anlamında

Ayrıca bakınız

Referanslar

^ L. Valiant. Öğrenilebilir bir teori. ACM'nin İletişimleri, 27, 1984.
^ Kearns ve Vazirani, sf. 1-12,
^ Balas Kausik Natarajan, Makine Öğrenimi, Teorik Bir Yaklaşım, Morgan Kaufmann Publishers, 1991
^ Blumer, Anselm; Ehrenfeucht, Andrzej; David, Haussler; Manfred, Warmuth (Ekim 1989). "Öğrenilebilirlik ve Vapnik-Chervonenkis Boyutu". Bilgisayar Makineleri Derneği Dergisi. 36 (4): 929–965. doi:10.1145/76359.76371. S2CID 1138467.

https://users.soe.ucsc.edu/~manfred/pubs/lrnk-olivier.pdf

Moran, Shay; Yehudayoff, Amir (2015). "VC sınıfları için örnek sıkıştırma şemaları". arXiv:1503.06960 [cs.LG ].

daha fazla okuma

M. Kearns, U. Vazirani. Hesaplamalı Öğrenme Teorisine Giriş. MIT Press, 1994. Bir ders kitabı.
M. Mohri, A. Rostamizadeh ve A. Talwalkar. Makine Öğreniminin Temelleri. MIT Press, 2018. Bölüm 2, PAC ile öğrenilebilirliğin ayrıntılı bir incelemesini içerir. Yayıncıdan açık erişimle okunabilir.
D. Haussler. Muhtemelen Yaklaşık Doğru (PAC) Öğrenme Çerçevesine Genel Bakış. Konuya giriş.
L. Valiant. Muhtemelen Yaklaşık Olarak Doğru. Basic Books, 2013. Hangi Valiant, PAC öğreniminin organizmaların nasıl geliştiğini ve öğrendiğini tanımladığını iddia eder.

[valiant-1] L. Valiant. Öğrenilebilir bir teori. ACM'nin İletişimleri, 27, 1984.

[2] Kearns ve Vazirani, sf. 1-12,

[3] Balas Kausik Natarajan, Makine Öğrenimi, Teorik Bir Yaklaşım, Morgan Kaufmann Publishers, 1991

[4] Blumer, Anselm; Ehrenfeucht, Andrzej; David, Haussler; Manfred, Warmuth (Ekim 1989). "Öğrenilebilirlik ve Vapnik-Chervonenkis Boyutu". Bilgisayar Makineleri Derneği Dergisi. 36 (4): 929–965. doi:10.1145/76359.76371. S2CID 1138467.

[1]

[2]

[3]

[4]