Являются ли регулярные выражения


16

Если у меня есть грамматика типа 3, она может быть представлена ​​в автомате (без каких-либо операций со стеком), поэтому я могу представлять регулярные выражения с использованием контекстно-свободных языков. Но могу ли я знать, что грамматика типа 3 - это , L L ( 1 ) , S L R ( 1 ) и т. Д. Без построения таблиц разбора?LR(1)LL(1)SLR(1)

Ответы:


15

Все обычные языки имеют грамматику LL (1). Чтобы получить такую ​​грамматику, возьмите любой DFA для обычного языка (возможно, выполняя конструкцию подмножества для NFA, полученного из регулярного выражения), а затем преобразуйте его в правильную рекурсивную регулярную грамматику. Тогда эта грамматика - LL (1), потому что любая пара производств для одного и того же нетерминала либо начинается с разных символов, либо генерирует ε и имеет $ в качестве маркера предварительного просмотра. Следовательно, все регулярные языки также являются LR (1), поскольку любая грамматика LL (1) является LR (1). Кроме того, используя важный результат из этой статьи , вы можете показать, что любой язык LR (1) имеет грамматику SLR (1), что означает, что любой обычный язык имеет грамматику SLR (1).

Тем не менее, обычные языки не все LR (0). Языки LR (0) имеют очень специфические свойства - в частности, они должны быть без префиксов. Таким образом, обычный язык {a, aa} не является LR (0), хотя он явно регулярен (регулярное выражение a | (aa)). Однако языки LR (0) неправильно содержатся в обычных языках; эта грамматика для {0 n 21 n | n ≥ 1} является LR (0), но язык не является регулярным:

S -> E
E -> 0E1 | 2

Надеюсь это поможет!


2
Тот факт, что правильные регулярные грамматики принимают в точности набор регулярных языков, обычно делается в классе (или даже в упражнениях), поэтому ответ гораздо более непосредственный.
Рафаэль

2

(Простой старый) синтаксис регулярного выражения (вы сказали «представление») - это LR (0). Вам не нужно искать, чтобы разобрать строку, представляющую регулярное выражение. Вы можете легко решить это, запустив генератор синтаксического анализатора для грамматики для регулярных выражений: -} Вы также можете легко закодировать простой анализатор рекурсивного спуска (LL (0)) для регулярных выражений; все, что является LL (0), является LR (0).

Я не знаю, похож ли синтаксис более сложных так называемых «регулярных выражений», таких как Perl; но регулярные выражения Perl строго более мощные, чем регулярные выражения, поэтому они не являются простыми старыми регулярными выражениями.

Чтобы определить, есть ли у грамматики какое-либо свойство, вы должны запустить какой-то предикат. Чтобы определить, является ли это (S) LR (k), вы должны запустить предикат, который может проверять это свойство. По сути, любой такой предикат должен фактически создавать таблицы разбора из-за способа их определения.


Perl регулярные выражения работает на NFA

Вопрос был не в том, как работал Perl регулярные выражения. Речь шла о том, были ли (Perl?) Регулярные выражения с помощью определенных технологий. Я могу поверить, что регулярные выражения Perl используют NFA для сопоставления, а также некоторые другие контекстно-зависимые сбор данных, но я не вижу актуальности для этого вопроса.

3
-1 Регулярные выражения не являются LR (0). Языки LR (0) должны быть без префиксов, но регулярное выражение a|(aa)описывает язык без префиксов. Кроме того, языки LR (0) не могут обрабатывать грамматики с продукцией epsilon, поэтому обычный язык {epsilon, a} не является LR (0). Тем не менее, обычными языками являются LL (1), потому что вы можете написать их как обычные грамматики, и, таким образом, все они LR (1). Поскольку любой язык LR (1) имеет грамматику SLR (1), это означает, что все обычные языки являются SLR (1).
templatetypedef

1
Что касается LL (0), то все наоборот: языки LL (0) являются подходящим подмножеством обычных языков. Обратите внимание, что LL (0) означает, что вы не используете прогнозирование для выбора между различными производными - это в основном означает, что нет никаких решений, и язык состоит из одного слова. LR (0), напротив, является полезным классом - опять же, вы не используете прогнозирование, чтобы принять решение (здесь для сокращений), но все же есть некоторое разнообразие, потому что сдвиг может различать разные произведения.

1
@ IraBaxter - Синтаксис регулярных выражений также не является LR (0), потому что регулярные выражения не свободны от префиксов. Они также не являются LL (0), потому что языки LL (0) могут содержать только одну строку (или без строк).
templatetypedef
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.