Можно ли решить, является ли язык, описываемый числом случаев, регулярным?

Известно, что язык слов, содержащих одинаковые числа 0 и 1, не является регулярным, а язык слов, содержащих одинаковые числа 001 и 100, является регулярным ( см. Здесь ).

Учитывая два слова , разрешимо ли, если язык слов, содержащий равное количество и является регулярным? $w_1,w_2$ $w_1$ $w_2$

regular-languages undecidability

— sdcvvc
источник

Можете ли вы привести другие примеры определенных языков, кроме и или и ? Как насчет примера с алфавитом из 3 символов?

1^{i} 0

$1^i0$

01^{i}

$01^i$

0^{i} 1

$0^i1$

10^{i}

$10^i$

— Бабу

Если является строгим подсловом , есть большая вероятность, что язык пустой, поэтому регулярный. Я не знаю других примеров.

w_{1}

$w_1$

w_{2}

$w_2$

— sdcvvc

Я подозреваю, что приведенные выше примеры являются единственными, что делает проблему разрешимой. Если вы укажете только две подстроки, я бы предположил, что это CF ... в зависимости от того, что вы можете указать в отношении случаев. Вы не достаточно точно определили, что вы подразумеваете под «описанным числом случаев».

— Бабу

Тело вопроса достаточно точное ИМО.

— sdcvvc

решения для особых случаев, похоже, основаны на идее, что вхождения подстрок

гарантируют только единичные вхождения промежуточного

. так что если предположить, что текущие ответы верны [пока мне не ясно], то, кажется, существует некоторая связь между

которая гарантирует в середине сканирования строки, что можно находиться в состоянии «равно» или «неравно» ", но только с максимальным конечным числом для" неравного "случая.

w_{1}

$w_1$

w_{2}

$w_2$

w_{1}

$w_1$

w_{2}

$w_2$

— vzn

Даны ли два слова , , разрешимо ли, если язык слов, содержащих одинаковое количество и , регулярен? $w_1$ $w_2$ $L$ $w_1$ $w_2$

Сначала некоторые определения:
они могут быть сделаны более краткими, и примечания могут быть улучшены, если они будут использоваться в доказательствах. Это только первый черновик.

Учитывая два слова и , мы говорим, что: $w_1$ $w_2$

всегда происходитс , отмечается , если $w_1$ $w_2$ $w_1\triangleleft w_2$
1. для любой строки такой, что с $s$ $s=xw_2y$ и существует другое разложение . Примечание: условие, что и $\mid x\mid,\, \mid y\mid\ \geq \mid w_1\mid +\mid w_2\mid$ $|x|_0,|x|_1|,|y|_0,|y|_1| \geq 1$ $s=x'w_1y'$
  $x$ $y$ каждый из них содержит как минимум 0 и 1 требуется в патологическом случае (найденном @sdcvvc): , и и его симметричные варианты. $w_1=1^i0$ $w_2=v1^{i+j}$ $y\in1^*$
2. есть строка с $s=xw_2y$ , что существует не более одного разложения $\mid x\mid,\, \mid y\mid\ \geq \mid w_1\mid +\mid w_2\mid$ $s=x'w_1y'$
всегда взаимодействуетс , отмечается $w_1$ $w_2$ , если каждый из них всегда встречается с другим, $w_1\triangleleft \triangleright\,w_2$
и происходит независимо другдруга, отмечено $w_1$ $w_2$ , если ни один не всегда встречается с другим, $w_1\triangleright \triangleleft\,w_2$
всегда встречается раз или больше,чем , отмечается , если для любой строки такой, что с существует других разложений $w_1$ $m$ $w_2$ $w_1\triangleleft_m w_2$ $s$ $s=xw_2y$ $\mid x\mid,\ \mid y\mid|\ \geq \mid w_1\mid +\mid w_2\mid$ $m$ $s=x_iw_1y_i$ для такой, что из следует . $i\in[1,m]$ $i\neq j$ $x_i\neq x_j$

Эти определения построены так, что мы можем игнорировать то, что происходит на концах строки, где должны присутствовать и . Граничные эффекты в конце строки должны анализироваться отдельно, но они представляют конечное число случаев (на самом деле я думаю, что я забыл один или два таких граничных подслуча в моем первом анализе ниже, но это не имеет большого значения). Определения совместимы с перекрытием случаев. $w_1$ $w_2$

Необходимо рассмотреть 4 основных случая (игнорируя симметрию между и ): $w_1$ $w_2$

Оба слова обязательно встречаются вместе, за исключением, возможно, на концах строки. Это касается только пар вида и или и . Это легко распознаетсяконечным автоматом,который только проверяет наличие одиночных вхождений на обоих концах строки, которая должна быть распознана, чтобы убедиться, что в обоих концах или ни на одном конце нет ни одного случая. Существует также вырожденный случай, когда : тогда язык L, очевидно, регулярен. $w_1\triangleleft \triangleright\,w_2$
$1^i0$ $01^i$ $0^i1$ $10^i$ $w_1=w_2$
, но не Одно из двух слов не может встречаться без другого, но обратное неверно (за исключением, возможно, в конце строки). Это происходит, когда: $w_1\triangleleft w_2$ $w_2\triangleleft w_1$
- является подстрокой : тогда конечный автомат может просто проверить, что не встречается вне экземпляра . $w_1$ $w_2$ $w_1$ $w_2$
- и для некоторого слова , : тогда конечный автомат проверяет, как в предыдущем случае, что не встречается отдельно от , Однако автомат позволяет считать один дополнительный экземпляр , который позволит принять, если $w_1=1^i0$ $w_2=v1^j$ $v\in\{0,1\}^*$ $v\neq01^i$ $w_1$ $w_2$ $w_1$ $w_2$ это суффикс строки. Есть три других симметричных случая (симметрия 1-0 и симметрия слева-справа).
Одно из двух слов встречается дважды в другом. Это может быть распознано конечной автоматизацией, которая проверяет, что меньшее слово никогда не встречается в строке. Это также немного более сложный вариант, который объединяет два варианта случая 2. В этом случае автомат проверяет, что меньшая строка никогда не встречается, за исключением, возможно, как часть в большей которая появляется как суффикс строки (и 3 других случая по симметрии). $w_1\triangleleft_2 w_2$
$1^i0$ $v$ $v1^j$
2 слова могут встречаться независимо друг от друга. Мы создаем обобщенную последовательную машину (gsm) которая выводит когда распознает вхождение и при распознавании вхождения , и забывает все остальное. Язык регулярен, только если язык регулярен. Но $w_1\triangleright \triangleleft\,w_2$
$G$ $a$ $w_1$ $b$ $w_2$ $L$ $G(L)$ который явно не зависит от контекста и не является регулярным. Следовательно, не является регулярным. На самом деле мы имеем . Так как обычные языки и языки без контекста закрыты при отображении gsm и обратном отображении gsm, мы также знаем, что зависит от контекста. $G(L)=\{w\in\{a,b\}^*\mid\ \mid w\mid_a=\mid w\mid_b\}$ $L$
$L=G^{-1}(G(L))$ $L$

Один из способов организовать формальное доказательство может быть следующим. Сначала создайте КПК, который распознает язык. На самом деле это можно сделать на машине с 1 счетчиком, но проще иметь два символа стека, чтобы избежать дублирования конечного элемента управления. Затем для случаев, когда это должен быть FA, покажите, что счетчик может быть ограничен константой, которая зависит только от двух слов. Для остальных случаев покажите, что счетчик может достигать любого произвольного значения. Конечно, КПК должен быть организован так, чтобы доказательства были достаточно легкими для переноски.

Представление FA как двухпакетных символов PDA, вероятно, является самым простым представлением для него. В нерегулярном случае конечная управляющая часть КПК такая же, как у GSM в приведенном выше наброске проверки. Вместо того , чтобы выводить «ы и » S , как в GSM, КПК подсчитывает разницу в количестве с стека. $a$ $b$

— Babou
источник

У меня был вопрос о свободе контекста в случае трех слов. Я удалил его, когда понял, что его можно проанализировать аналогичным образом. Сначала я подумал, что доказательство отсутствия CFness сделает оригинальное упражнение, но GSM разрушает его.

— Бабу

Непонятно, что вы подразумеваете под «происходить независимо друг от друга», «обязательно собраться вместе» и т. Д. Вместо этого напишите формальные определения и докажите, что они охватывают все случаи.

— sdcvvc

Я не уверен, что вы спрашиваете, и какой уровень формализации вам нужен, для какой цели. Я понял, что анализировать возможные отношения двух слов от руки не гарантируется, и все равно не имеет значения. Важно то, может ли вхождение одного слова существовать, не создавая в то же время вхождения (или нескольких) другого слова. Детали не имеют значения, так как они всегда будут локализованы и, таким образом, управляемы конечным образом. Два конца не имеют значения, так как они также локализованы. Даже совпадения случаев не имеют значения, поскольку их может быть только конечное число в 1 месте

— babou

Я спросил вас о точных определениях терминов, упомянутых в комментарии. Спасибо, что написали их. Я должен был угадать их раньше? В любом случае, вы, кажется, утверждаете, что

. Это не удовлетворяет условию 1. определения «

всегда встречается с

», поскольку в

не встречается

0^{i} 1 ◃ ▹ 1 0^{i}

$0^i 1 \triangleleft \triangleright 1 0^i$

w_{1}

$w_1$

w_{2}

$w_2$

1 0^{i}

$1 0^i$

s = 0^{M} 0^{i} 1 1^{M}

$s=0^M 0^i 1 1^M$

— sdcvvc

Извините, я не хотел вас догадываться. Мне потребовалось время, чтобы понять, что именно вы хотели. Мой провал только. Что касается вашего встречного примера, вы правы. Но для меня это только означает, что я должен быть немного более осторожным с теломерами, в определении отношений. Я определил их слишком быстро, но

или

не дают много информации в этом контексте. Это действительно пограничный патологический пример в патологическом случае, который на самом деле не может иметь место, если используется более 2 символов. Я просто не верю, что это что-то меняет.

0^{M}

$0^M$

1^{M}

$1^M$

— Бабу