Maksimal munch - Maximal munch

İçinde bilgisayar Programlama ve bilgisayar Bilimi, "maksimal munch"veya"en uzun maç", bir yapı oluştururken, mümkün olduğunca mevcut girdinin çoğunun tüketilmesi gerektiği ilkesidir.

Bu terimin bilinen en eski kullanımı R.G.G. Cattell doktora tezinde[1] otomatik türetilmesinde kod üreteçleri için derleyiciler.

Uygulama

Örneğin, sözcük sözdizimi çoğunun Programlama dilleri bunu gerektirir jetonlar giriş akışından mümkün olan maksimum sayıda karakterden oluşturulabilir. Bu, yaygın olarak kullanılan doğal belirsizlik sorununu çözmek için yapılır. düzenli ifadeler gibi [a-z] + (bir veya daha fazla küçük harf).[2]

Terim ayrıca derleyiciler içinde talimat seçimi bir "döşeme" yöntemini tanımlama aşaması - yapılandırılmış bir ağacın bir programdaki bir programı nasıl temsil ettiğini belirleme ara dil doğrusala dönüştürülmelidir makine kodu. Tüm bir alt ağacın tamamı tek bir makine talimatına dönüştürülebilir ve sorun, ağacın her biri bir makine talimatını temsil eden üst üste binmeyen "karolara" nasıl bölüneceğidir. Etkili bir strateji, herhangi bir noktada mümkün olan en büyük alt ağacın bir döşemesini yapmaktır, buna "maksimal munch" denir.[3]

Dezavantajlar

Bazı durumlarda, "maksimal munch" istenmeyen veya beklenmedik sonuçlara yol açar. Örneğin, C programlama dili, ifade x = y / * z; (herhangi bir boşluk olmadan) muhtemelen bir sözdizimi hatasına yol açacaktır, çünkü /* karakter dizisi sonlandırılmamış veya bitiş belirteci tarafından sonlandırılmış (istenmeyen) bir yorum başlatır */ daha sonra, ilgisiz gerçek yorum (C'deki yorumlar iç içe geçmez). İfadede aslında kastedilen, değişkene atamaktı x değerin bölünmesinin sonucu y başvurunun kaldırılmasıyla elde edilen değer ile Işaretçi z; bu tamamen geçerli bir kod olacaktır (çok yaygın olmasa da). Boşluktan yararlanılarak veya kullanılarak ifade edilebilir. x = y / (* z);.

Başka bir örnek C ++, "açılı ayraç" karakterlerini kullanır < ve > sözdiziminde şablon uzmanlığı, ancak iki ardışık > karakterler olarak yorumlanır sağa kaydırma Şebeke >>.[4] C ++ 11'den önce, aşağıdaki kod bir ayrıştırma hatası üretiyordu, çünkü iki dik açılı ayraç simgesi yerine sağa kaydırma operatör simgesiyle karşılaşılıyor:

    std::vektör<std::vektör<int>> benim_mat_11; // C ++ 03'te yanlış, C ++ 11'de doğru.    std::vektör<std::vektör<int> > benim_mat_03; // C ++ 03 veya C ++ 11'de düzeltin.

C ++ 11 Ağustos 2011'de kabul edilen standart dilbilgisini değiştirdi böylece bir sağa kaydırma jetonu bir çift dik açılı ayraçla eşanlamlı olarak kabul edilir ( Java ), dilbilgisini karmaşıklaştıran ancak maksimal munch ilkesinin sürekli kullanımına izin veren.

Alternatifler

Programlama dilleri araştırmacıları ayrıca, maksimal munch ilkesini diğer sözcüksel belirsizliği giderme taktikleriyle değiştirerek veya tamamlayarak yanıt verdiler. Yaklaşımlardan biri, en uzun eşleşmeyi doğrudan almak yerine, karakterlerin neler yapabileceğine bazı kısıtlamalar getirecek olan "kısıtlamaları takip etme" yi kullanmaktır. takip et geçerli bir eşleşme. Örneğin, dizelerin eşleşmesini şart koşmak [a-z] + ardından gelen alfabetik karakter, bu normal ifadeyle maksimal munch ile aynı etkiyi elde eder.[5] Başka bir yaklaşım da, maksimal munch ilkesini korumak, ancak onu bağlam gibi başka bir ilkeye tabi kılmaktır (Örneğin., Java'daki sağa kaydırma belirteci bir jenerik sözdizimsel olarak geçersiz olduğu ifade).[6]

Referanslar

  1. ^ Cattell, R. G. G. “Kod Oluşturucuların Biçimlendirilmesi ve Otomatik Türetilmesi”. Doktora tezi, 1978. Carnegie Mellon Üniversitesi, Pittsburgh, Pensilvanya, ABD
  2. ^ Aho et al., 168.
  3. ^ Sayfa, 470.
  4. ^ Vandevoorde.
  5. ^ Van den Marka et al., 26.
  6. ^ Van Wyk et al., 63.

Kaynakça

  • Aho, Alfred V .; Lam, Monica S .; Sethi, Ravi; Ullman, Jeffrey D. (2007). Derleyiciler: İlkeler, Teknikler ve Araçlar (2. baskı). Boston: Addison-Wesley. ISBN  978-0-321-48681-3.
  • Sayfa, Daniel (2009). "Derleyiciler". Bilgisayar Mimarisine Pratik Giriş. Bilgisayar Bilimlerinde Metinler. Londra: Springer. s. 451–493. doi:10.1007/978-1-84882-256-6_11. ISBN  978-1-84882-255-9.
  • Van den Brand, Mark G.J .; Scheerder, Jeroen; Vinju, Jurgen J .; Visser, Eelco (2002). Tarayıcısız Genelleştirilmiş LR Ayrıştırıcılar için Netleştirme Filtreleri. Bilgisayar Bilimlerinde Ders Notları. 2304/2002. Berlin / Heidelberg: Springer. s. 21–44. doi:10.1007/3-540-45937-5_12. ISBN  978-3-540-43369-9. ISSN  0302-9743.
  • Vandevoorde, Daveed (14 Ocak 2005). "Dik Açılı Parantezler". Alındı 31 Mart 2010.
  • Van Wyk, Eric; Schwerdfeger, Ağustos (2007). Genişletilebilir Dilleri Ayrıştırmak İçin Bağlama Duyarlı Tarama. GPCE '07: 6. Uluslararası Üretim Programlama ve Bileşen Mühendisliği Konferansı Bildirileri. New York: ACM. s. 63–72. doi:10.1145/1289971.1289983. ISBN  9781595938558.