GLR ayrıştırıcı - GLR parser

Bir GLR ayrıştırıcı ("Genelleştirilmiş LR" anlamına gelen GLR, burada L "soldan sağa" ve R "en sağdaki (türetme)" anlamına gelir) bir LR ayrıştırıcı işlenecek algoritma kararsız ve belirsiz gramerler.[1] Teorik temel, 1974 tarihli bir makalede sağlandı[2] Bernard Lang tarafından (GLL gibi diğer genel Bağlamdan bağımsız ayrıştırıcılarla birlikte). Bu tür algoritmaları üretmenin sistematik bir yolunu açıklar ve doğruluk kanıtları, gramer sınıflarına göre karmaşıklık ve optimizasyon teknikleri ile ilgili tek tip sonuçlar sağlar. GLR'nin ilk gerçek uygulaması, 1984 tarihli bir makalede, Masaru Tomita aynı zamanda "paralel ayrıştırıcı" olarak da anılır. Tomita orijinal çalışmasında beş aşama sundu:[3] pratikte GLR ayrıştırıcısı olarak tanınan ikinci aşamadır.

Algoritma, orijinal formlarından bu yana gelişmesine rağmen, ilkeler bozulmadan kaldı. Daha önceki bir yayında gösterildiği gibi,[4] Lang, öncelikle daha kolay kullanılan ve daha esnek ayrıştırıcılarla ilgileniyordu. genişletilebilir programlama Diller. Tomita'nın amacı ayrıştırmaktı Doğal lisan tam ve verimli bir şekilde metin. Standart LR ayrıştırıcıları barındırılamaz kararsız ve belirsiz doğası Doğal lisan ve GLR algoritması yapabilir.

Algoritma

Kısaca, GLR algoritması benzer şekilde çalışır. LR ayrıştırıcı algoritması dışında, belirli bir dilbilgisi verildiğinde, bir GLR ayrıştırıcısı, belirli bir girdinin tüm olası yorumlarını bir enine arama. Ön uçta bir GLR ayrıştırıcı oluşturucu bir giriş gramerini bir LR oluşturucusuna benzer bir şekilde ayrıştırıcı tablolarına dönüştürür. Ancak, LR ayrıştırma tablolarının yalnızca bir Devlet geçişi (bir durum ve bir giriş belirteci verildiğinde), GLR ayrıştırma tabloları çoklu geçişlere izin verir. Aslında, GLR, çatışmaları kaydırmaya / azaltmaya ve azaltmaya / azaltmaya izin verir.

Çakışan bir geçişle karşılaşıldığında, ayrıştırma yığını iki veya daha fazla paralel ayrıştırma yığınına ayrılır; burada olası her geçişe karşılık gelen durum en üsttedir. Daha sonra, bir sonraki giriş simgesi okunur ve "üst" durumların her biri için sonraki geçişleri belirlemek için kullanılır - ve daha fazla çatallanma meydana gelebilir. Verilen herhangi bir üst durum ve giriş belirteci en az bir geçişle sonuçlanmazsa, ayrıştırma tablolarındaki bu "yol" geçersizdir ve atılabilir.

Önemli bir optimizasyon, bu yığınların genel öneklerinin ve son eklerinin paylaşılmasına olanak tanır ve bu da genel arama alanı ve giriş metnini ayrıştırmak için gereken bellek kullanımı. Bu iyileştirmeden kaynaklanan karmaşık yapılar, arama grafiğini Yönlendirilmiş döngüsüz grafiği (çeşitli düğümlerin "derinlikleri" üzerinde ek kısıtlamalarla) bir ağaçtan ziyade.

Avantajları

GLR algoritmasını kullanan tanıma, en kötü durum zaman karmaşıklığına sahiptir. CYK algoritması ve Earley algoritması: Ö(n3).[kaynak belirtilmeli ] Bununla birlikte, GLR'nin iki ek avantajı vardır:

  • Algoritmayı çalıştırmak için gereken süre, gramerdeki belirsizlik derecesiyle orantılıdır: deterministik gramerler üzerinde GLR algoritması çalışır Ö(n) zaman (bu Earley için doğru değil[kaynak belirtilmeli ] ve CYK algoritmaları, ancak orijinal Earley algoritmaları bunu sağlamak için değiştirilebilir)
  • GLR algoritması "çevrimiçidir" - yani, giriş jetonlarını belirli bir sırayla tüketir ve her jetonu tükettikten sonra mümkün olduğunca çok iş yapar.

Pratikte, çoğu programlama dilinin gramerleri deterministiktir veya "neredeyse deterministiktir", yani herhangi bir belirsizliğin genellikle küçük (ancak muhtemelen sınırsız) sayıda simge içinde çözüldüğü anlamına gelir.[kaynak belirtilmeli ]. Bağlamdan bağımsız gramerlerin tüm sınıfını (Earley veya CYK gibi) işleyebilen diğer algoritmalarla karşılaştırıldığında, GLR algoritması bu "neredeyse deterministik" gramerler üzerinde daha iyi performans sağlar, çünkü çoğu zaman yalnızca tek bir yığın etkin olacaktır. ayrıştırma süreci.

GLR ile birleştirilebilir LALR (1) karma ayrıştırıcıda, daha yüksek performans sağlayan algoritma.[5]

Ayrıca bakınız

Referanslar

  1. ^ Masaru Tomita (6 Aralık 2012). Genelleştirilmiş LR Ayrıştırma. Springer Science & Business Media. ISBN  978-1-4615-4034-2.
  2. ^ Lang Bernard (1974). Loeckx, J. (ed.). "Belirleyici olmayan verimli ayrıştırıcılar için deterministik teknikler". Otomata, Diller ve Programlama, 2. Kolokyum. Bilgisayar Bilimlerinde Ders Notları. Saarbrücken: Springer. 14: 255–269. doi:10.1007/3-540-06841-4_65. ISBN  978-3-540-06841-9. ISSN  0302-9743.
  3. ^ Masaru Tomita. Doğal dil için verimli ayrıştırma. Kluwer Academic Publishers, Boston, 1986.
  4. ^ Lang, Bernard (Aralık 1971). "Paralel, deterministik olmayan aşağıdan yukarıya ayrıştırma". ACM SIGPLAN Bildirimleri. Genişletilebilir diller üzerine uluslararası sempozyum bildirileri. 6 (12): 56–57. doi:10.1145/942582.807982.
  5. ^ "Elkhound, Elsa ve Cqual ++: C ++ için Açık Kaynak Statik Analiz".

daha fazla okuma

  • Grune, Dick; Jacobs, Ceriel J.H (2008). Ayrıştırma Teknikleri. Springer Science + Business Media. ISBN  978-0-387-20248-8.
  • Tomita, Masaru (1984). "Doğal diller için LR ayrıştırıcıları". COLING. 10. Uluslararası Hesaplamalı Dilbilim Konferansı. s. 354–357.
  • Tomita, Masaru (1985). "Doğal diller için etkili bir bağlamdan bağımsız ayrıştırma algoritması". IJCAI. Uluslararası Yapay Zeka Ortak Konferansı. s. 756–764.