FORR - FORR

FORR (Doğru Nedenler İçin) bir bilişsel mimari için öğrenme ve problem çözme esinlenen Herbert A. Simon 'ın fikirleri sınırlı rasyonellik ve tatmin edici. İlk olarak 1990'ların başında, New York Şehir Üniversitesi. Kullanıldı oyun oynama robot yol bulma, rekreasyonel park tasarımı, sözlü diyalog sistemleri ve çözme NP-zor kısıtlama tatmin sorunları ve birçok problem çözme uygulaması için yeterince geneldir.

Arka fon

Sınırlı rasyonellik

FORR, bir problemin nasıl çözüleceğine dair mükemmel bilgiye sahip değildir, bunun yerine deneyimden öğrenir. Akıllı ajanlar optimal değildir, ancak tüm olası iyi nedenlerin ve bilgilendirici verilerin yalnızca bir alt kümesine dayalı olarak kararlar alın. Bu ajanlar hala rasyonel olarak kabul edilebilir. Bu fikir sınırlı rasyonellik tarafından tanıtıldı Herbert A. Simon,[1] kiminle birlikte Allen Newell bilişsel mimariler çalışmasının ilk temellerini geliştirdi ve ayrıca Yükselmek ve ACT-R.

Birden çok iyi neden

FORR, bir sorunu çözerken eylemleri gerçekleştirmek için birden fazla neden veya gerekçenin olduğu fikrine dayanır. Bu nedenler her zaman doğru olabilir (satrançta rakibi şah mat yapacak bir hamle yapmak her zaman doğrudur) veya bazen doğru olabilir. Her zaman doğru nedenler azınlıktır. Bazen doğru olan nedenler birbirini tamamlayabilir: örneğin, oyun oynarken, iyi bir neden parçaları yakalamak olabilirken, diğeri tahtanın bir alanını kontrol etmek olabilir. FORR'da, bu birbiriyle yarışan nedenlere Danışmanlar denir.

Katmanlı Danışman sistemi, herhangi bir potansiyel iyi nedenden ötürü yeterince geneldir; olasılığa dayalı, tümdengelimli veya algısal Bir eylemi diğerine tercih etmesi konusunda tavsiyede bulunduğu sürece uygulanabilir.

Bir dizi bağımsız temsilciye (Danışmanlar) güvenmesi nedeniyle, FORR bir bağlantıcı mimari.

Mimarlık

Bir FORR mimarisinin üç bileşeni vardır: bir dizi tanımlamalar sorunun durumunu tanımlayan, katmanlı bir dizi Danışman hangi eylemin gerçekleştirileceğine karar vermek için danışılan ve davranışsal komut dosyası Danışmanları sorgular ve önerdikleri eylemi gerçekleştirir.[2]


Danışman

Danışmanlar, bir karar vermek için gerekli gerekçeler veya buluşsal yöntemler kümesidir. Onlar kabul edilebilir Işlemsel bellek mimarinin bileşeni. Her yeni karar üzerine, hangi eylemin gerçekleştirileceğine karar vermek için Danışmanlar sorgulanır. Danışmanlar asla birbirleriyle iletişim kurmazlar veya kendi başlarına öğrenirler: sadece tanımlayıcılar şeklinde saklanan problemin durumu hakkında bilgi ister ve bu bilgilere dayanarak bir öneride bulunurlar. Danışmanlar, aşağıdaki sırayla sorgulanan üç kademeye ayrılmıştır:

  • Aşama 1: Bu Danışmanlar her zaman haklıdır. Bunlar bir eylem önerirse, o eylem hemen gerçekleştirilir ve sorgu sona erer. Bir eylemi yasaklarlarsa, bu eylem dikkate alınmaz. Aksi takdirde, bir sonraki aşamaya geçin.
  • Aşama 2: Bu Danışmanlardan biri tetiklendi, bir alt problem veya sıralı bir eylemler dizisi önerir ve genel problemi çözmede bir alt hedefe ulaşır (bir labirentte bir engelin etrafında hareket etmek gibi). Hiçbir katman 2 danışmanı tetiklenmezse, son katmana geçin.
  • Aşama 3: Bunların tümü diğer gerekçelerdir. Her zaman haklı değildirler, ancak birbirleriyle rekabet ederler. Bir eyleme oy verirler ve en yüksek oyu alan öneri yerine getirilir. Aynı alandaki farklı problem sınıfları, aynı Danışmanlar için farklı ağırlıklara sahip olacak ve ağırlıklar deneyim yoluyla geliştirilecektir. öğrenme algoritmalar.

Tanımlamalar

Bildirimsel bellek mimarinin bileşeni, tanımlayıcılar sorunun durumunu temsil eder ve herhangi bir Danışman tarafından kullanılabilir.

Davranışsal komut dosyası

Davranışsal komut dosyası, her bir Danışman katmanını sırayla sorgular. Seviye 1 Danışmanı bir eylem önerirse, komut dosyası eylemi gerçekleştirir. Aksi takdirde, bir Kademe 2 Danışmanı tetiklenirse, bu bir alt problemle karşılaşıldığı anlamına gelir. Aşama 1 Danışmanı, herhangi bir zamanda yalnızca bir Aşama 2 Danışmanının etkin olduğunu garanti eder. Aşama 1 Danışman yorumu yoksa ve Aşama 2 Danışmanı tetiklenmezse, davranışsal komut dosyası tüm Kademe 3 Danışmanlardan öneri veya yorum ister ve oy vermelerine izin verir. Komut dosyası, tüm 3. kademe danışmanlar arasında en yüksek oyu alan eylemi gerçekleştirir.

FORR mimarisinin uygulanması

Problem alanı, problem sınıfları adı verilen benzer problemler kümesidir. Sorunlu alan adı basit masa oyunları oynuyorsa, tic-tac-toe bir problem sınıfıdır ve belirli bir tic-tac-toe oyunu bir problem örneğidir. Bir labirentte gezinmek sorunlu etki alanıysa, o zaman belirli bir labirent sınıftır ve onun gezinmesine yönelik bir girişim bir örnektir. Sorun alanı belirlendikten sonra, bu alan için bir FORR mimarisinin uygulanmasının iki temel aşaması vardır: olası doğru nedenleri bulmak (Danışmanlar) ve belirli bir sınıf için ağırlıklarını öğrenmek.

FORR mimarisi nasıl oluşturulur

  1. Sorunlu bir etki alanına karar verin.
  2. Alandaki farklı sınıflar için iyi ya da kötü olabilecek bir karar vermek için olası gerekçelerin bir listesini sıralamak için alan bilgisini, literatür incelemelerini, sezgiyi ve sağduyuyu kullanın. Bu gerekçeler Danışmanlardır.
  3. Danışmanları katmanlara ayırın:
    1. Her zaman haklı olan Danışmanlar Kademe 1'dedir. Örneğin, bir tahta oyununda kazanan bir hamle yapmak her zaman doğrudur.
    2. Bir alt problemi tanımlayan Danışmanlar Kademe 2'ye gider. Örneğin, bir labirentte bir duvarın etrafında dolaşmak.
    3. Diğer tüm Danışmanlar Seviye 3'tür.
  4. Danışmanları kodlayın. Her Danışman, önerilen her eylem için ağırlıklarla birlikte bir dizi önerilen eylemi döndürür. Ağırlıklar başlangıçta 0.05 gibi tek tip bir değere ayarlanır.
  5. Tüm Danışmanların ihtiyaç duyduğu sorunun durumu hakkında tüm bilgileri tanımlayın. Bunlar tanımlayıcılardır. Bunları kodlayın.
  6. Danışmanları sorgulayan ve önerdikleri eylemi gerçekleştiren davranışsal komut dosyasını kodlayın.
  7. Danışmanların bir dizi belirli sorun durumundaki ağırlıklarını öğrenin. Öğrenme Aşaması kullanarak Takviye öğrenme algoritması.
  8. Mimariyi, daha önce karşılaşılmamış bir dizi sorun örneği üzerinde test edin.

Öğrenme Danışmanı ağırlıkları

Danışmanlar bir alandaki tüm problem sınıfları için aynıdır, ancak alandaki her sınıf için ağırlıklar farklı olabilir. Tic-tac-toe için önemli buluşsal yöntemler, farklı bir masa oyunu için önemli olmayabilir. FORR, 3. kademe Danışmanlarının ağırlıklarını deneyimle öğrenir. Başarısızlıkla sonuçlanan bir eylem öneren danışmanların ağırlıkları cezalandırılır ve önerileri başarı ile sonuçlanan Danışmanların ağırlıkları artırılır. Öğrenme algoritmaları uygulamalar arasında farklılık gösterir.

Başvurular

FORR, oyun oynama, robot yol bulma, kısıtlama tatmin sorunları park tasarımı ve sözlü diyalog sistemleri.[3][4]

Ayrıca bakınız

Referanslar

  1. ^ Simon, H.A. (1981) Yapay Bilimler
  2. ^ Epstein (1992) Çatışmadan Çıkar Sağlama: FORR Mimarisi
  3. ^ Örnek uygulamalar için bkz. FORR ana sayfası
  4. ^ FORR'un sesli iletişim sistemlerinde kullanımı için, bkz. Loqui projesi
Notlar

Dış bağlantılar