Kleenes algoritması - Kleenes algorithm - Wikipedia

İçinde teorik bilgisayar bilimi özellikle resmi dil teorisi, Kleene algoritması verileni dönüştürür kesin olmayan sonlu otomat (NFA) bir Düzenli ifade. Diğer dönüştürme algoritmalarıyla birlikte, çeşitli açıklama formatlarının denkliğini oluşturur. normal diller. Aynı yöntemin alternatif sunumları, atfedilen "eleme yöntemini" içerir. Brzozowski ve McCluskey algoritması McNaughton ve Yamada,^[1] ve kullanımı Arden lemması.

Algoritma açıklaması

Gross ve Yellen'e (2004) göre,^[2] algoritma geriye doğru izlenebilir Kleene (1956).^[3] Algoritmanın bir sunumu durumunda deterministik sonlu otomata (DFA'lar) Hopcroft ve Ullman'da (1979) verilmektedir.^[4] Aşağıdaki NFA'lar için algoritmanın sunumu Gross ve Yellen'i (2004) takip etmektedir.^[2]

Verilen bir kesin olmayan sonlu otomat M = (Q, Σ, δ, q₀, F), ile Q = { q₀,...,q_n } onun kümesi eyaletler algoritma hesaplar

takımlar R^k
_ij alan tüm dizelerin M eyaletten q_ben -e q_j daha yüksek numaralı herhangi bir durumdan geçmeden k.

Burada "bir durumdan geçmek", ve bırakıyorum, yani ikisi de ben ve j daha yüksek olabilir k, ancak hiçbir ara durum olmayabilir. R^k
_ij düzenli bir ifade ile temsil edilir; algoritma bunları adım adım hesaplar k = -1, 0, ..., n. Bundan daha büyük numaralı bir devlet olmadığından n, normal ifade Rⁿ
_0j alan tüm dizelerin kümesini temsil eder M ondan başlangıç durumu q₀ -e q_j. Eğer F = { q₁,...,q_f } kümesidir eyaletleri kabul et, Düzenli ifade Rⁿ
₀₁ | ... | Rⁿ
_0f dili temsil eder kabul edilmiş tarafından M.

İçin ilk normal ifadeler k = -1, aşağıdaki gibi hesaplanır ben≠j:

R⁻¹
_ij = a₁ | ... | a_m nerede q_j ∈ δ (q_ben,a₁), ..., q_j ∈ δ (q_ben,a_m)

ve aşağıdaki gibi ben=j:

R⁻¹
_ii = a₁ | ... | a_m | ε nerede q_ben ∈ δ (q_ben,a₁), ..., q_ben ∈ δ (q_ben,a_m)

Diğer bir deyişle, R⁻¹
_ij dan geçişi etiketleyen tüm harflerden bahseder ben -e jve aynı zamanda, ben=j.

Bundan sonra, her adımda ifadeler R^k
_ij öncekilerden hesaplanır

R^k
_ij = R^k-1
_ik (R^k-1
_kk)^* R^k-1
_kj | R^k-1
_ij

Algoritmanın işleyişini anlamanın bir başka yolu, 0'dan 0'a kadar olan durumların olduğu bir "eleme yöntemi" dir. n art arda kaldırılır: ne zaman durumu k kaldırılır, normal ifade R^k-1
_ij, durumdan bir yolu etiketleyen kelimeleri tanımlayan ben>k belirtmek j>k, yeniden yazılır R^k
_ij "elimine edilmiş" durumdan geçme olasılığını hesaba katmak için k.

İndüksiyon ile kuzunluğunun olduğu gösterilebilir^[5] her ifadenin R^k
_ij en fazla 1/3(4^k+1(6s+7) - 4) semboller, nerede s Σ 'deki karakter sayısını gösterir. Bu nedenle, kabul ettiği dili temsil eden normal ifadenin uzunluğu M en fazla 1/3(4ⁿ⁺¹(6s+7)f - f - 3) semboller, nerede f Bu üstel patlama kaçınılmazdır, çünkü herhangi bir eşdeğer düzenli ifadenin üstel boyutta olması gereken DFA aileleri vardır.^[6]

Pratikte, algoritmanın çalıştırılmasıyla elde edilen normal ifadenin boyutu, durumların prosedür tarafından dikkate alındığı sıraya, yani 0'dan numaralandırıldıkları sıraya bağlı olarak çok farklı olabilir. n.

Misal

Kleene algoritmasına verilen örnek DFA

Resimde gösterilen otomat şu şekilde tanımlanabilir: M = (Q, Σ, δ, q₀, F) ile

eyaletler kümesi Q = { q₀, q₁, q₂ },
giriş alfabesi Σ = { a, b },
geçiş fonksiyonu δ ile δ (q₀,a)=q₀, δ (q₀,b)=q₁, δ (q₁,a)=q₂, δ (q₁,b)=q₁, δ (q₂,a)=q₁ve δ (q₂,b)=q₁,
başlangıç durumu q₀, ve
kabul durumları kümesi F = { q₁ }.

Kleene'nin algoritması ilk düzenli ifadeleri şu şekilde hesaplar:

R⁻¹ ₀₀	= a \| ε
R⁻¹ ₀₁	= b
R⁻¹ ₀₂	= ∅
R⁻¹ ₁₀	= ∅
R⁻¹ ₁₁	= b \| ε
R⁻¹ ₁₂	= a
R⁻¹ ₂₀	= ∅
R⁻¹ ₂₁	= a \| b
R⁻¹ ₂₂	= ε

Bundan sonra R^k
_ij dan hesaplanır R^k-1
_ij adım adım k = 0, 1, 2.Kleene cebiri eşitlikler, normal ifadeleri olabildiğince basitleştirmek için kullanılır.

Adım 0

R⁰ ₀₀	= R⁻¹ ₀₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₀ \| R⁻¹ ₀₀	= (a \| ε)	(a \| ε)^*	(a \| ε)	\| a \| ε	= a^*
R⁰ ₀₁	= R⁻¹ ₀₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₁ \| R⁻¹ ₀₁	= (a \| ε)	(a \| ε)^*	b	\| b	= a^* b
R⁰ ₀₂	= R⁻¹ ₀₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₂ \| R⁻¹ ₀₂	= (a \| ε)	(a \| ε)^*	∅	\| ∅	= ∅
R⁰ ₁₀	= R⁻¹ ₁₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₀ \| R⁻¹ ₁₀	= ∅	(a \| ε)^*	(a \| ε)	\| ∅	= ∅
R⁰ ₁₁	= R⁻¹ ₁₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₁ \| R⁻¹ ₁₁	= ∅	(a \| ε)^*	b	\| b \| ε	= b \| ε
R⁰ ₁₂	= R⁻¹ ₁₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₂ \| R⁻¹ ₁₂	= ∅	(a \| ε)^*	∅	\| a	= a
R⁰ ₂₀	= R⁻¹ ₂₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₀ \| R⁻¹ ₂₀	= ∅	(a \| ε)^*	(a \| ε)	\| ∅	= ∅
R⁰ ₂₁	= R⁻¹ ₂₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₁ \| R⁻¹ ₂₁	= ∅	(a \| ε)^*	b	\| a \| b	= a \| b
R⁰ ₂₂	= R⁻¹ ₂₀ (R⁻¹ ₀₀)^* R⁻¹ ₀₂ \| R⁻¹ ₂₂	= ∅	(a \| ε)^*	∅	\| ε	= ε

Aşama 1

R¹ ₀₀	= R⁰ ₀₁ (R⁰ ₁₁)^* R⁰ ₁₀ \| R⁰ ₀₀	= a^*b	(b \| ε)^*	∅	\| a^*	= a^*
R¹ ₀₁	= R⁰ ₀₁ (R⁰ ₁₁)^* R⁰ ₁₁ \| R⁰ ₀₁	= a^*b	(b \| ε)^*	(b \| ε)	\| a^* b	= a^* b^* b
R¹ ₀₂	= R⁰ ₀₁ (R⁰ ₁₁)^* R⁰ ₁₂ \| R⁰ ₀₂	= a^*b	(b \| ε)^*	a	\| ∅	= a^* b^* ba
R¹ ₁₀	= R⁰ ₁₁ (R⁰ ₁₁)^* R⁰ ₁₀ \| R⁰ ₁₀	= (b \| ε)	(b \| ε)^*	∅	\| ∅	= ∅
R¹ ₁₁	= R⁰ ₁₁ (R⁰ ₁₁)^* R⁰ ₁₁ \| R⁰ ₁₁	= (b \| ε)	(b \| ε)^*	(b \| ε)	\| b \| ε	= b^*
R¹ ₁₂	= R⁰ ₁₁ (R⁰ ₁₁)^* R⁰ ₁₂ \| R⁰ ₁₂	= (b \| ε)	(b \| ε)^*	a	\| a	= b^* a
R¹ ₂₀	= R⁰ ₂₁ (R⁰ ₁₁)^* R⁰ ₁₀ \| R⁰ ₂₀	= (a \| b)	(b \| ε)^*	∅	\| ∅	= ∅
R¹ ₂₁	= R⁰ ₂₁ (R⁰ ₁₁)^* R⁰ ₁₁ \| R⁰ ₂₁	= (a \| b)	(b \| ε)^*	(b \| ε)	\| a \| b	= (a \| b) b^*
R¹ ₂₂	= R⁰ ₂₁ (R⁰ ₁₁)^* R⁰ ₁₂ \| R⁰ ₂₂	= (a \| b)	(b \| ε)^*	a	\| ε	= (a \| b) b^* a \| ε

Adım 2

R² ₀₀	= R¹ ₀₂ (R¹ ₂₂)^* R¹ ₂₀ \| R¹ ₀₀	= a^b^ba	((a\|b)b^a \| ε)^	∅	\| a^*	= a^*
R² ₀₁	= R¹ ₀₂ (R¹ ₂₂)^* R¹ ₂₁ \| R¹ ₀₁	= a^b^ba	((a\|b)b^a \| ε)^	(a\|b)b^*	\| a^* b^* b	= a^* b (a (a \| b) \| b)^*
R² ₀₂	= R¹ ₀₂ (R¹ ₂₂)^* R¹ ₂₂ \| R¹ ₀₂	= a^b^ba	((a\|b)b^a \| ε)^	((a\|b)b^*a \| ε)	\| a^* b^* ba	= a^* b^* b (a (a \| b) b^)^ a
R² ₁₀	= R¹ ₁₂ (R¹ ₂₂)^* R¹ ₂₀ \| R¹ ₁₀	= b^* a	((a\|b)b^a \| ε)^	∅	\| ∅	= ∅
R² ₁₁	= R¹ ₁₂ (R¹ ₂₂)^* R¹ ₂₁ \| R¹ ₁₁	= b^* a	((a\|b)b^a \| ε)^	(a\|b)b^*	\| b^*	= (a (a \| b) \| b)^*
R² ₁₂	= R¹ ₁₂ (R¹ ₂₂)^* R¹ ₂₂ \| R¹ ₁₂	= b^* a	((a\|b)b^a \| ε)^	((a\|b)b^*a \| ε)	\| b^* a	= (a (a \| b) \| b)^* a
R² ₂₀	= R¹ ₂₂ (R¹ ₂₂)^* R¹ ₂₀ \| R¹ ₂₀	= ((a\|b)b^*a \| ε)	((a\|b)b^a \| ε)^	∅	\| ∅	= ∅
R² ₂₁	= R¹ ₂₂ (R¹ ₂₂)^* R¹ ₂₁ \| R¹ ₂₁	= ((a\|b)b^*a \| ε)	((a\|b)b^a \| ε)^	(a\|b)b^*	\| (a \| b) b^*	= (a \| b) (a (a \| b) \| b)^*
R² ₂₂	= R¹ ₂₂ (R¹ ₂₂)^* R¹ ₂₂ \| R¹ ₂₂	= ((a\|b)b^*a \| ε)	((a\|b)b^a \| ε)^	((a\|b)b^*a \| ε)	\| (a \| b) b^* a \| ε	= ((a \| b) b^* a)^*

Dan beri q₀ başlangıç durumu ve q₁ tek kabul durumu, normal ifade R²
₀₁ otomat tarafından kabul edilen tüm dizelerin kümesini belirtir.

Ayrıca bakınız

Floyd – Warshall algoritması - Kleene'nin algoritması tarafından belirli bir Kleene cebiri
Yıldız yüksekliği sorunu - belirli bir DFA'ya karşılık gelen tüm düzenli ifadelerin minimum yıldız yuvalama derinliği nedir?
Genelleştirilmiş yıldız yüksekliği sorunu - normal ifadelerde ek olarak bir tamamlayıcı işlecine izin veriliyorsa, yıldızların yuvalama derinliği Kleene algoritmasının çıktısının sabit bir sınırla sınırlandırılması?
Thompson'ın yapım algoritması - düzenli bir ifadeyi sonlu bir otomata dönüştürür

Referanslar

^ McNaughton, R .; Yamada, H. (Mart 1960). Otomata için "Düzenli İfadeler ve Durum Grafikleri". Elektronik Bilgisayarlarda IRE İşlemleri. EC-9 (1): 39–47. doi:10.1109 / TEC.1960.5221603. ISSN 0367-9950.
^ ^a ^b Jonathan L. Gross ve Jay Yellen, ed. (2004). Çizge Teorisi El Kitabı. Ayrık Matematik ve Uygulamaları. CRC Basın. ISBN 1-58488-090-2. Burada: bölüm 2.1, s.65'teki R13'e dikkat edin
^ Kleene, Stephen C. (1956). "Sinir Ağlarında ve Sonlu Otomatta Olayların Temsili" (PDF). Otomata Çalışmaları, Annals of Math. Çalışmalar. Princeton Üniv. Basın. 34. Burada: bölüm 9, s. 37-40
^ John E. Hopcroft, Jeffrey D. Ullman (1979). Otomata Teorisi, Dilleri ve Hesaplamaya Giriş. Addison-Wesley. ISBN 0-201-02988-X. Burada: Bölüm 3.2.1 sayfalar 91-96
^ Daha doğrusu, normal ifade simgelerinin sayısı "a_ben"," ε "," | ","^*"," · "; Parantezleri saymaz.
^ Gruber, Hermann; Holzer, Markus (2008). Aceto, Luca; Damgård, Ivan; Goldberg, Leslie Ann; Halldórsson, Magnús M .; Ingólfsdóttir, Anna; Walukiewicz, Igor (editörler). "Sonlu Otomata, Dijital Grafik Bağlantısı ve Normal İfade Boyutu". Otomata, Diller ve Programlama. Bilgisayar Bilimlerinde Ders Notları. Springer Berlin Heidelberg. 5126: 39–50. doi:10.1007/978-3-540-70583-3_4. ISBN 9783540705833.. Teorem 16.

[1] McNaughton, R .; Yamada, H. (Mart 1960). Otomata için "Düzenli İfadeler ve Durum Grafikleri". Elektronik Bilgisayarlarda IRE İşlemleri. EC-9 (1): 39–47. doi:10.1109 / TEC.1960.5221603. ISSN 0367-9950.

[gross2004handbook-2] Jonathan L. Gross ve Jay Yellen, ed. (2004). Çizge Teorisi El Kitabı. Ayrık Matematik ve Uygulamaları. CRC Basın. ISBN 1-58488-090-2. Burada: bölüm 2.1, s.65'teki R13'e dikkat edin

[3] Kleene, Stephen C. (1956). "Sinir Ağlarında ve Sonlu Otomatta Olayların Temsili" (PDF). Otomata Çalışmaları, Annals of Math. Çalışmalar. Princeton Üniv. Basın. 34. Burada: bölüm 9, s. 37-40

[4] John E. Hopcroft, Jeffrey D. Ullman (1979). Otomata Teorisi, Dilleri ve Hesaplamaya Giriş. Addison-Wesley. ISBN 0-201-02988-X. Burada: Bölüm 3.2.1 sayfalar 91-96

[5] Daha doğrusu, normal ifade simgelerinin sayısı "a_ben"," ε "," | ","^*"," · "; Parantezleri saymaz.

[6] Gruber, Hermann; Holzer, Markus (2008). Aceto, Luca; Damgård, Ivan; Goldberg, Leslie Ann; Halldórsson, Magnús M .; Ingólfsdóttir, Anna; Walukiewicz, Igor (editörler). "Sonlu Otomata, Dijital Grafik Bağlantısı ve Normal İfade Boyutu". Otomata, Diller ve Programlama. Bilgisayar Bilimlerinde Ders Notları. Springer Berlin Heidelberg. 5126: 39–50. doi:10.1007/978-3-540-70583-3_4. ISBN 9783540705833.. Teorem 16.

[1]

[2]

[3]

[4]

[5]

[6]

R¹ ₀₀	= R⁰ ₀₁ (R⁰ ₁₁)^* R⁰ ₁₀ \| R⁰ ₀₀	= a^*b	(b \| ε)^*	∅	\| a^*	= a^*
R¹ ₀₁	= R⁰ ₀₁ (R⁰ ₁₁)^* R⁰ ₁₁ \| R⁰ ₀₁	= a^*b	(b \| ε)^*	(b \| ε)	\| a^* b	= a^* b^* b
R¹ ₀₂	= R⁰ ₀₁ (R⁰ ₁₁)^* R⁰ ₁₂ \| R⁰ ₀₂	= a^*b	(b \| ε)^*	a	\| ∅	= a^* b^* ba
R¹ ₁₀	= R⁰ ₁₁ (R⁰ ₁₁)^* R⁰ ₁₀ \| R⁰ ₁₀	= (b \| ε)	(b \| ε)^*	∅	\| ∅	= ∅
R¹ ₁₁	= R⁰ ₁₁ (R⁰ ₁₁)^* R⁰ ₁₁ \| R⁰ ₁₁	= (b \| ε)	(b \| ε)^*	(b \| ε)	\| b \| ε	= b^*
R¹ ₁₂	= R⁰ ₁₁ (R⁰ ₁₁)^* R⁰ ₁₂ \| R⁰ ₁₂	= (b \| ε)	(b \| ε)^*	a	\| a	= b^* a
R¹ ₂₀	= R⁰ ₂₁ (R⁰ ₁₁)^* R⁰ ₁₀ \| R⁰ ₂₀	= (a \| b)	(b \| ε)^*	∅	\| ∅	= ∅
R¹ ₂₁	= R⁰ ₂₁ (R⁰ ₁₁)^* R⁰ ₁₁ \| R⁰ ₂₁	= (a \| b)	(b \| ε)^*	(b \| ε)	\| a \| b	= (a \| b) b^*
R¹ ₂₂	= R⁰ ₂₁ (R⁰ ₁₁)^* R⁰ ₁₂ \| R⁰ ₂₂	= (a \| b)	(b \| ε)^*	a	\| ε	= (a \| b) b^* a \| ε

R² ₀₀	= R¹ ₀₂ (R¹ ₂₂)^* R¹ ₂₀ \| R¹ ₀₀	= a^b^ba	((a\|b)b^a \| ε)^	∅	\| a^*	= a^*
R² ₀₁	= R¹ ₀₂ (R¹ ₂₂)^* R¹ ₂₁ \| R¹ ₀₁	= a^b^ba	((a\|b)b^a \| ε)^	(a\|b)b^*	\| a^* b^* b	= a^* b (a (a \| b) \| b)^*
R² ₀₂	= R¹ ₀₂ (R¹ ₂₂)^* R¹ ₂₂ \| R¹ ₀₂	= a^b^ba	((a\|b)b^a \| ε)^	((a\|b)b^*a \| ε)	\| a^* b^* ba	= a^* b^* b (a (a \| b) b^)^ a
R² ₁₀	= R¹ ₁₂ (R¹ ₂₂)^* R¹ ₂₀ \| R¹ ₁₀	= b^* a	((a\|b)b^a \| ε)^	∅	\| ∅	= ∅
R² ₁₁	= R¹ ₁₂ (R¹ ₂₂)^* R¹ ₂₁ \| R¹ ₁₁	= b^* a	((a\|b)b^a \| ε)^	(a\|b)b^*	\| b^*	= (a (a \| b) \| b)^*
R² ₁₂	= R¹ ₁₂ (R¹ ₂₂)^* R¹ ₂₂ \| R¹ ₁₂	= b^* a	((a\|b)b^a \| ε)^	((a\|b)b^*a \| ε)	\| b^* a	= (a (a \| b) \| b)^* a
R² ₂₀	= R¹ ₂₂ (R¹ ₂₂)^* R¹ ₂₀ \| R¹ ₂₀	= ((a\|b)b^*a \| ε)	((a\|b)b^a \| ε)^	∅	\| ∅	= ∅
R² ₂₁	= R¹ ₂₂ (R¹ ₂₂)^* R¹ ₂₁ \| R¹ ₂₁	= ((a\|b)b^*a \| ε)	((a\|b)b^a \| ε)^	(a\|b)b^*	\| (a \| b) b^*	= (a \| b) (a (a \| b) \| b)^*
R² ₂₂	= R¹ ₂₂ (R¹ ₂₂)^* R¹ ₂₂ \| R¹ ₂₂	= ((a\|b)b^*a \| ε)	((a\|b)b^a \| ε)^	((a\|b)b^*a \| ε)	\| (a \| b) b^* a \| ε	= ((a \| b) b^* a)^*