Как создать DFA из регулярного выражения без использования NFA?

12

Цель состоит в том, чтобы создать DFA из регулярного выражения, и использование «Regular exp> NFA> DFA преобразование» не вариант. Как это сделать?

Я задал этот вопрос нашему профессору, но он сказал мне, что мы можем использовать интуицию, и любезно отказался дать какие-либо объяснения. Поэтому я хотел спросить вас.

«Преобразование регулярного exp> NFA> DFA» не является опцией, потому что такое преобразование занимает много времени для преобразования довольно сложного регулярного выражения. Например, для определенного регулярного выражения "регулярное выражение> NFA> DFA" человеку требуется 1 час. Мне нужно преобразовать регулярное выражение в DFA менее чем за 30 минут.

— Рафаэль
источник

2

Вы должны предоставить больше контекста. Какой (неформальный) алгоритм вы сейчас используете для перевода регулярных выражений? Может быть полезно объяснить ваш процесс на примере, например a(a|ab|ac)*a+. Вы можете либо напрямую перевести это в NDFA, который вы уменьшаете до DFA, либо вы можете нормализовать его к чему-то, что немедленно отображается в DFA.

— Am

Нужно ли вам делать это на конкретных примерах какими-либо средствами, или вы должны предоставить общую процедуру, которая будет применяться компьютером?

— Бабу

18

Поскольку вы хотите «преобразовать регулярные выражения в DFA менее чем за 30 минут», я полагаю, вы работаете вручную над сравнительно небольшими примерами.

В этом случае вы можете использовать алгоритм Бжозовского , который вычисляет непосредственно автомат Нерода языка (который, как известно, равен его минимальному детерминированному автомату). Он основан на прямом вычислении производных, а также работает для расширенных регулярных выражений, допускающих пересечение и дополнение. Недостаток этого алгоритма состоит в том, что он требует проверки эквивалентности выражений, вычисленных по пути, дорогостоящего процесса. Но на практике и для небольших примеров это очень эффективно. $[1]$

Левые коэффициенты . Пусть язык а слово. Тогда Язык называется левый фактор (или левой производной ) из . $L$ $A^*$ $u$

U^{- 1} L знак равно {v \in A^{*} | U v \in L}

$u^{-1}L = \{v \in A^* \mid uv \in L \}$

u^{- 1} L

$u^{-1}L$

L

$L$

Неродный автомат . Nerode автомат из является детерминированным автоматом , где , и определена функция перехода для каждого $L$ $\mathcal{A}(L) = (Q, A, \cdot, L, F)$ $Q = \{u^{-1}L \mid u \in A^*\}$ $F = \{u^{-1}L \mid u \in L\}$ , по формуле Остерегайтесь этого довольно абстрактного определения. Каждое состояние является левым частным по слову и, следовательно, является языком . Начальное состояние языка , и множество конечных состояний есть множество всех левых частных по слову . $a \in A$

(U^{- 1} L) \cdot a знак равно a^{- 1} (U^{- 1} L) знак равно (U a)^{- 1} L

$(u^{-1}L)\cdot a = a^{-1}(u^{-1}L)=(ua)^{-1}L$

A

$\mathcal{A}$

L

$L$

A^{*}

$A^*$

L

$L$

L

$L$

L

$L$

$a, b$

\begin{aligned} a^{- 1} 1 & знак равно 0 & a^{- 1} б & знак равно {\begin{cases} 1 & если a знак равно б \\ 0 & если a \neq б \end{cases} \\ a^{- 1} (L_{1} \cup L_{2}) & знак равно a^{- 1} L_{1} \cup U^{- 1} L_{2}, & a^{- 1} (L_{1} ∖ L_{2}) & знак равно a^{- 1} L_{1} ∖ U^{- 1} L_{2}, \\ a^{- 1} (L_{1} \cap L_{2}) & знак равно a^{- 1} L_{1} \cap U^{- 1} L_{2}, & a^{- 1} L^{*} & знак равно (a^{- 1} L) L^{*} \end{aligned}

$\begin{align*} a^{-1}1 &= 0 & a^{-1}b &= \begin{cases} 1 &\text{if $a = b$}\\ 0 &\text{if $a \not= b$}\\ \end{cases}\\ a^{-1}(L_1 \cup L_2) &= a^{-1}L_1 \cup u^{-1}L_2,& a^{-1}(L_1 \setminus L_2) &= a^{-1}L_1 \setminus u^{-1}L_2,\\ a^{-1}(L_1 \cap L_2) &= a^{-1}L_1 \cap u^{-1}L_2, & a^{-1}L^* &= (a^{-1}L)L^* \end{align*}$

\begin{aligned} a^{- 1} (L_{1} L_{2}) & знак равно {\begin{cases} (a^{- 1} L_{1}) L_{2} & си 1 \notin L_{1}, \\ (a^{- 1} L_{1}) L_{2} \cup a^{- 1} L_{2} & си 1 \in L_{1} \end{cases} \end{aligned}

$\begin{align*} a^{-1}(L_1L_2) &= \begin{cases} (a^{-1}L_1)L_2 &\text{si $1 \notin L_1$,}\\ (a^{-1}L_1)L_2 \cup a^{-1}L_2 &\text{si $1 \in L_1$}\\ \end{cases}\\ %\\v^{-1}(u^{-1}L) &= (uv)^{-1}L. \end{align*}$

$L = (a(ab)^*)^* \cup (ba)^*$

\begin{aligned} 1^{- 1} L & знак равно L знак равно L_{1} \\ a^{- 1} L_{1} & знак равно (a б)^{*} (a (a б)^{*})^{*} знак равно L_{2} \\ б^{- 1} L_{1} & знак равно a (б a)^{*} знак равно L_{3} \\ a^{- 1} L_{2} & знак равно б (a б)^{*} (a (a б)^{*})^{*} \cup (a б)^{*} (a (a б)^{*})^{*} знак равно б L_{2} \cup L_{2} знак равно L_{4} \\ б^{- 1} L_{2} & знак равно \emptyset \\ a^{- 1} L_{3} & знак равно (б a)^{*} знак равно L_{5} \\ б^{- 1} L_{3} & знак равно \emptyset \\ a^{- 1} L_{4} & знак равно a^{- 1} (б L_{2} \cup L_{2}) знак равно a^{- 1} L_{2} знак равно L_{4} \\ б^{- 1} L_{4} & знак равно б^{- 1} (б L_{2} \cup L_{2}) знак равно L_{2} \cup б^{- 1} L_{2} знак равно L_{2} \\ a^{- 1} L_{5} & знак равно \emptyset \\ б^{- 1} L_{5} & знак равно a (б a)^{*} знак равно L_{3} \end{aligned}

$\begin{align*} 1^{-1}L &= L=L_1\\ a^{-1}L_1 &=(ab)^*(a(ab)^*)^*=L_2\\ b^{-1}L_1 &= a(ba)^*=L_3\\ a^{-1}L_2 &= b(ab)^*(a(ab)^*)^* \cup (ab)^*(a(ab)^*)^*=bL_2 \cup L_2=L_4\\ b^{-1}L_2 &=\emptyset \\ a^{-1}L_3 &=(ba)^*=L_5\\ b^{-1}L_3 &=\emptyset \\ a^{-1}L_4 &= a^{-1}(bL_2 \cup L_2)=a^{-1}L_2=L_4 \\ b^{-1}L_4 &= b^{-1}(bL_2 \cup L_2)= L_2\cup b^{-1}L_2 = L_2 \\ a^{-1}L_5 &= \emptyset\\ b^{-1}L_5 &=a(ba)^*=L_3 \end{align*}$ Минимальный автомат

$[1]$

Редактировать . (5 апреля 2015 г.) Я только что обнаружил, что похожий вопрос: какие существуют алгоритмы для построения DFA, который распознает язык, описываемый данным регулярным выражением? был задан вопрос по истории. Ответ частично решает проблемы сложности.

— J.-E. Штырь
источник

Можете ли вы сказать больше о сложности этого алгоритма?

— Бабу

@babou Преобразование RE в DFA является сложным для PSPACE, поэтому оно определенно экспоненциальное.

— jmite

Это, вероятно, должно идти в ответ. ОП начинается с «стандартных конструкций через NFA слишком медленные», и часть ответа кажется «неудачей, на самом деле быстрого решения не существует». Осталось обсудить, лучше ли это здесь, чем стандартная конструкция. (cc @jmite)

— Рафаэль

@jmite Да, я ожидал этого. Причина моего вопроса заключается в том, почему этот способ построения DFA следует рассматривать проще. (примечание: системе потребовался целый день, чтобы уведомить меня о ответе @ jmite).

— Бабу

2

J.-E. Пин дает лучший ответ с точки зрения формальности и полноты, но я думаю, что есть кое-что, что можно сказать о «интуиции», на которую намекает ваш профессор.

В большинстве этих случаев проще всего посмотреть на регулярное выражение, понять, какой язык он принимает, а затем использовать свой творческий потенциал / ум, чтобы создать DFA, принимающий этот язык.

Нет простого способа сделать это, кроме алгоритмов, которые дали другие, но вот некоторые рекомендации, которые могут оказаться полезными.

Спросите себя, могу ли я написать программу, которая принимает этот RE, используя только логические или очень маленькие целочисленные переменные? Затем напишите эту программу и преобразуйте ее в DFA, где есть состояние для каждой комбинации значений.
Ищите части регулярного выражения, которые, как вы знаете, вы можете принять детерминистически, где вы знаете: «Если я это увижу, то я должен соответствовать этой части RE». Их не всегда будет много, но идентификация этих частей может показать части, которые будет легко создать DFA, так что вы можете потратить больше времени на части, которые действительно требуют недетерминизма.
Построение подмножества для NFA-> DFA на самом деле не так уж сложно в алгоритме. Так что, если это задание, а не экзаменационный вопрос, может быть быстрее просто кодировать реализацию и позволить вашей программе преобразовывать NFA в DFA. Если вы использовали свой собственный код, не должно быть никаких проблем с плагиатом.

$P=NP=PSPACE$

Старайтесь «смотреть в будущее», срезать углы, когда вы можете использовать свою интуицию в тех случаях, когда алгоритм потребует много шагов, но его результат очевиден.

— jmite
источник

-2

Хотя это не правильный путь, но он работает большую часть времени.

Первый шаг : найдите наименьшую строку, которая может быть принята регулярным выражением. Второй шаг : нарисуйте необходимые состояния с помощью транзакции машины, принимающей минимальную строку. Третий шаг : для всех штатов нарисуйте оставшиеся алфавиты транзакций.

Например: регулярное выражение (0 + 1) * 1 "Строка, заканчивающаяся 1" Шаг 1: Наименьшая строка: 1 Шаг 2: два состояния Q0 и Q1. имея транзакцию 1 от Q0 до Q1. и Q1 - принимающее состояние. Шаг 3: для Q0-состояния Q0 1 транзакция идет в Q1. Теперь сделайте 0 транзакцию в самом Q0. Для Q1 State Q1 1 транзакция останется в Q1. И 0 транзакция пойдет в Q0.

— Навин CS
источник