Особый класс языков: «круговые» языки. Это известно?

20

Определите следующий класс «круговых» языков поверх конечного алфавита Sigma. На самом деле, название уже существует для обозначения другой вещи, которая, кажется, используется в области вычислений ДНК. AFAICT, это другой класс языков.

Язык L является круговым, если для всех слов $w$ в $\Sigma^*$ имеем:

$w$ принадлежит L тогда и только тогдакогда для всех целых $k > 0$ , $w^k$ которой принадлежит L.

Известен ли этот класс языков? Мне интересны циркулярные языки, которые также являются регулярными и, в частности:

имя для них, если они уже известны
разрешимость проблемы с учетом автомата (в частности: DFA), подчиняется ли принятый язык приведенному выше определению

fl.formal-languages automata-theory regular-language

— vincenzoml
источник

1

Это очень интересный вопрос. Два связанных вопроса: 1) если у нас есть обычный язык L и связанный с ним DFA, можем ли мы сделать его циркулярным? 2) Для любого языка L верно ли, что circ (L) регулярный или имеет некоторые хорошие свойства?

— Суреш Венкат

PS Возможно, это очевидно, но почему вы думаете, что циркулярные языки являются подклассом обычных языков?

— Суреш Венкат

3

@ Суреш, я думаю, что он определяет язык как круговой, если он а) регулярный; б) удовлетворяет замкнутости

∀w∈L,n∈N:wn∈L $\forall w \in L, n \in \mathbb{N} : w^n \in L$ .

— Питер Тейлор

Кросспост в МО .

— Сянь-Чи Чанг 之之

1

Может быть, спасибо не следует публиковать, но это был мой первый вопрос, и я высоко оценил качество комментариев, ответов и обсуждения. Благодарю.

— vincenzoml

19

В первой части мы показываем экспоненциальный алгоритм для определения округлости. Во второй части мы покажем, что эта проблема трудоемкая. В третьей части мы покажем, что каждый циркулярный язык является объединением языков вида $r^+$ (здесь может быть пустым регулярным выражением); союз не обязательно не пересекается. В четвертой части мы показываем круговой язык, который нельзя записать в виде непересекающейся суммы . $r$ $\sum r_i^+$

Изменить: Внесены некоторые исправления после комментариев Марка. В частности, мои более ранние утверждения о том, что цикличность является coNP-полной или NP-сложной, исправлены.

Редактировать: Исправлена нормальная форма из $\sum r_i^*$ до . Выставлен «по своей сути неоднозначный» язык. $\sum r_i^+$

Продолжая комментарий Питера Тейлора, вот как решить (крайне неэффективно), является ли язык круговым, учитывая его DFA. Построить новый DFA, чьи состояния являются корнями старых состояний. Этот новый DFA запускает копий старого DFA параллельно. $n$ $n$

Если язык не циклический, то есть слово такое, что если мы несколько раз пропустим его через DFA, начиная с начального состояния , то получим состояния такие, что принимает, кроме одного из других не принимает (если все они принимают, то последовательность $w$ $s_0$ $s_1,\ldots,s_n$ $s_1$ $s_0,\ldots,s_n$ должна циклически изменяться, чтобы всегда было в языке). Другими словами, у нас есть путь от $w^*$ до где принимает, но один из других не принимает. И наоборот, если язык круговой, то этого не может быть. $s_0,\ldots,s_{n-1}$ $s_1,\ldots,s_n$ $s_1$

Таким образом, мы сократили проблему до простого теста направленной достижимости (просто отметьте все возможные «плохие» кортежи). $n$

Проблема округлости является трудоемкой. Предположим, нам дан экземпляр 3SAT с переменными и предложениями . Можно предположить, что $n$ $\vec{x}$ $m$ $C_1,\ldots,C_m$ $n = m$ (добавить фиктивные переменные) и что простое (иначе найти простое число между и используя тестирование простоты AKS, и добавить фиктивные переменные и предложения). $n$ $n$ $2n$

Рассмотрим следующий язык: «вход не имеет форму где - удовлетворительное присваивание для ». Для этого языка легко построить DFA. Если язык не круговой, то в языке есть слово , некоторая сила которого не в языке. Поскольку единственные слова, отсутствующие в языке, имеют длину $\vec{x}_1 \cdots \vec{x}_n$ $\vec{x}_i$ $C_i$ $O(n^2)$ $w$ , должно иметь длину или . Если это длины $n^2$ $w$ $1$ $n$ , рассмотрим (оно все еще на языке), так что на языке, а на языке. Тот факт, что отсутствует в языке, означает, что является удовлетворительным назначением. $1$ $w^n$ $w$ $w^n$ $w^n$ $w$

И наоборот, любое удовлетворительное присваивание переводится как слово, доказывающее некруглость языка: удовлетворяющее присваивание принадлежит языку, а - нет. Таким образом, язык является круговым, если экземпляр 3SAT неудовлетворителен. $w$ $w^n$

В этой части мы обсудим нормальную форму для циркулярных языков. Рассмотрим некоторый DFA для кругового языка . Последовательность в реальном , если (начальное состояние), все остальные государства принимают и означает $L$ $C = C_0,\ldots$ $C_0 = s$ $C_i = C_j$ . Таким образом, каждая действительная последовательность в конечном итоге является периодической, и существует только конечное число действительных последовательностей (поскольку DFA имеет конечное число состояний). $C_{i+1} = C_{j+1}$

Мы говорим, что слово ведет себя согласно $C$ если слово переводит DFA из состояния в состояние для всех . Множество всех таких слов $c_i$ $c_{i+1}$ $i$ $E(C)$ регулярно (аргумент аналогичен первой части этого ответа). Заметим , что представляет собой подмножество . $E(C)$ $L$

Для реальной последовательности определите как последовательность . Последовательность также действительна. Поскольку существует только конечное число различных последовательностей , язык являющийся объединением всех , также является регулярным. $C$ $C^k$ $C^k(t) = C(kt)$ $C^k$ $C^k$ $D(C)$ $E(C^k)$

Покажем, что обладает тем свойством, что если то . Действительно, предположим, что и . Тогда . Таким образом, можно записать в виде $D(C)$ $x,y \in D(C)$ $xy \in D(C)$ $x \in C^k$ $y \in C^l$ $xy \in C^{k+l}$ $D(C) = D(C)^+$ для некоторого регулярного выражения . $r^+$ $r$

Каждое слово в языке соответствует некоторой реальной последовательности , то существует реальная последовательность , что ведет себя в соответствии с. Таким образом , является объединением в течение всего действительной последовательности . Поэтому каждый циркулярный язык имеет представление вида . И наоборот, каждый такой язык является круговым (тривиально). $w$ $C$ $C$ $w$ $L$ $D(C)$ $C$ $\sum r_i^+$

Рассмотрим круговой язык всех слов над которые содержат четное число или 's или четное число ' (или оба). Покажем, что она не может быть записана как непересекающаяся сумма ; под «дизъюнктом» мы подразумеваем, что $L$ $a,b$ $a$ $b$ $\sum r_i^+$ . $r_i^+ \cap r_j^+ = \varnothing$

Пусть будет размером некоторого DFA для , а будет нечетным целым числом. Рассмотрим , Поскольку , для некоторого . По насосным леммам, можно накачать префикс длин не более . Таким образом, порождает $N_i$ $r_i^+$ $N > \max N_i$ $x = a^N b^{N!}$ $x \in L$ $x \in r_i^+$ $i$ $x$ $N$ $r_i^+$ , Точно так же порождается некоторым , что также порождает . Обратите вниманиечто , так как . Таким образом, представление не может быть дизъюнктивным. $z = a^{N!} b^{N!}$ $y = a^{N!} b^N$ $r_j^+$ $z$ $i \neq j$ $xy \notin L$

— Юваль Фильмус
источник

Кажется, здесь есть ряд ошибок. Вы сокращаете с UNSAT, а не с SAT, поэтому вы показываете, что это тяжело. Какое свидетельство о полиномиальном времени для (не) членства?

— Марк Рейтблатт

«Поскольку единственные слова не в языке имеют длину

» Разве это не должно быть

? n2 $n^2$

nm $nm$

— Марк Рейтблатт

Я не думаю, что это "тривиально в coNP". По крайней мере, это не очевидно для меня. «Очевидным» сертификатом будет строка

в языке и степень

такая что

отсутствует в языке. Но для меня не сразу понятно, почему такое слово должно иметь полиномиальный размер. Возможно, из-за простого факта теории автоматов я упускаю из виду. l $l$

k $k$

lk $l^k$

— Марк Рейтблатт

Еще более серьезный очевидный недостаток заключается в том, что вы переходите от каждого предложения, которое является удовлетворительным в отдельности, ко всей формуле, которая может быть удовлетворена. Если, конечно, я неправильно читаю.

— Марк Рейтблатт

Я согласен с тем, что не ясно, что цикличность в coNP. С другой стороны, я не вижу проблем в остальной части аргумента (теперь, когда я поставил

). Если каждое предложение удовлетворяется одним и тем же назначением, то это назначение удовлетворяет экземпляру 3SAT. n=m $n = m$

— Юваль Фильмус

17

Вот некоторые документы, которые обсуждают эти языки:

Тьерри Кашат, Сила однобуквенных рациональных языков, DLT 2001, Springer LNCS # 2295 (2002), 145-154.

S. Hovath, P. Leupold, G. Lischke, Корни и возможности регулярных языков, DLT 2002, Springer LNCS # 2450 (2003), 220-230.

H. Bordihn, «Контекстно-свободная сила власти контекстно-свободных языков неразрешима», TCS 314 (2004), 445-449.

— Джеффри Шаллит
источник

6

@ Дэйв Кларк, L = a * | b * будет круглым, но L * будет (a | b) *.

С точки зрения разрешимости язык является круговым, если существует такой что является замыканием под + или если он является конечным объединением круговых языков. $L$ $L'$ $L$ $L'$

(Мне не терпится переопределить «циклический», заменив ваш на . Это многое упрощает. Затем мы можем охарактеризовать циклические языки как те, для которых существует NDFA, начальное состояние которого имеет только эпсилон-переходы в принимающие состояния и имеет эпсилон-переход к каждому принимающему состоянию). $>$ $\ge$

— Питер Тейлор
источник

Вы правы. Я удалил свой неправильный пост.

— Дэйв Кларк

Что касается адаптации с

: я думаю, что минимальный DFA всегда должен иметь ровно одно принимающее состояние, а именно начальное состояние. Может быть, может случиться больше принимающих состояний, но тогда им нужен

переход в начальное состояние. ≥ $\geq$

ε $\varepsilon$

— Рафаэль

1

@ Рафаэль, рассмотри еще раз L = a * | b *. DFA, начальное состояние которого является единственным принимающим состоянием и которое принимает a и b, должно принимать (a | b) *.

— Питер Тейлор

По вопросу о разрешимости, опять же: предположим, у вас есть DFA с

состояниями, которые принимает

. Предположим, что он принимает слово

, а также принимает

,

, ...,

. Тогда он принимает

для

. (Доказательство - это прямое применение принципа голубя). Если возможно показать, что минимальный (минимизирующий

) контрпример (

,

n $n$

na $n_a$

w $w$

w2 $w^2$

w3 $w^3$

wna+1 $w^{n_a+1}$

wx $w^x$

x>0 $x > 0$

|w| $|w|$

w $w$

x $x$ ) если округлость языка, принятого DFA, имеет длину, ограниченную функцией

то возможно тестирование методом грубой силы. Я подозреваю, что

, но я этого не доказал. n $n$

|w|<=n+1 $|w| <= n+1$

— Питер Тейлор

Чтобы продолжить идею @ Рафаэля выше. Идея начального состояния = только принять состояние неверна для этой проблемы, но она действительно отражает некоторые интересные свойства. Когда M является minDFA, начальное состояние является единственным допустимым состоянием, если и только если L (M) является звездой Клини без префиксного языка. Это один из моих любимых лакомых кусочков DFA, поэтому я быстро поделюсь им! ;)

— mikero

5

Изменить: Полное (упрощенное) доказательство полноты PSPACE появляется ниже.

Два обновления. Во-первых, нормальная форма, описанная в моем другом ответе, появляется уже в статье Calbrix и Nivat под названием « Префикс и периодические языки рациональных языков». $\omega$ , к сожалению, недоступной в Интернете.

Во-вторых, решение о том, является ли язык циклическим, учитывая, что его DFA является PSPACE-полным.

Круговая форма в PSPACE. Так как NPSPACE = PSPACE по теореме Савича, достаточно дать алгоритм NPSPACE для некруглости. Пусть DFA с государств. Тот факт, что синтаксический моноид имеет размер не более подразумевает, что если не является круговым, то существует слово длиной не более $A = (Q,\Sigma,\delta,q_0,F)$ $|Q|=n$ $L(A)$ $n^n$ $L(A)$ $w$ $n^n$ такой, что но для некоторого . Алгоритм догадок и вычисляет для всех , используя пространства (используется для подсчета до ). Затем он проверяет, что $w \in L(A)$ $w^k \notin L(A)$ $k \leq n$ $w$ $\delta_w(q) = \delta(q,w)$ $q \in Q$ $O(n\log n)$ $n^n$ но для некоторого . $\delta_w(q_0) \in F$ $\delta_w^{(k)} \notin F$ $k \leq n$

Круглость PSPACE-сложная. Козен показал в своей классической работе 1977 г. « Нижние оценки для систем естественных доказательств», что с учетом списка DFA трудно решить, является ли пересечение принятых ими языков пустым. Мы сводим эту проблему к круглости. Для заданных двоичных DFA мы находим простое число и строим троичную DFA принимающую язык $A_1,\ldots,A_n$ $p \in [n,2n]$ $A$ (Приложив немного больше усилий, мы также можем сделатьдвоичный файл). Нетрудно увидеть (используя тот факт, чтопростое), чтоявляется круговым тогда и только тогда, когда пересечениепусто.

L (A) = {2 w 1 2 w 2 \dots 2 w p : w i \in L (A 1 + (i mod n))} ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ .

$L(A) = \overline{\{2w_12w_2\cdots2w_p : w_i \in L(A_{1+(i\mod{n})})\}}.$

A $A$

p $p$

L(A) $L(A)$

L(A1)∩⋯∩L(An) $L(A_1) \cap \cdots \cap L(A_n)$

— Юваль Фильмус
источник

0

Любое длины можно записать в виде где , . Очевидно, что и . Отсюда следует, что язык является регулярным для непустых входов по лемме накачки. $s \in L$ $p>0$ $xy^{i}z$ $x = z = \epsilon$ $y = w \neq \epsilon$ $|xy| \leq p$ $|y| = |w| > 0$

Для определение выполняется, поскольку NDFA, который принимает пустую строку, также будет принимать любое количество пустых строк. $w= \epsilon$

Объединение вышеуказанных языков - это язык L, и поскольку регулярные языки закрыты при объединении, из этого следует, что каждый циркулярный язык является регулярным.

По теореме Райс неразрешима. Доказательство аналогично регулярности. $CIRCULARITY/TM$

— chazisop
источник

1

Лемма накачки является необходимым, но не достаточным условием регулярности. В частности, существуют нерегулярные языки, удовлетворяющие условию накачки. Кроме того , Райс теорема будет сказать , что

неразрешима. Это вовсе не означает , что

неразрешима (где

- DFA,

a TM)! Например, тестирование пустоты для DFA является решающим, в то время как тестирование пустоты для TM - нет. {⟨M⟩|L(M) is circular} $\{\langle M\rangle\vert L(M)\text{ is circular}\}$

{⟨D⟩|L(D) is circular} $\{\langle D\rangle\vert L(D)\text{ is circular}\}$

D $D$

M $M$

— альпог

1

Here's a non-computable circular language. Let

D={0x1:x∈R} $D = \{ 0^x 1 : x \in R\}$ , where

R $R$ is some non-computable language (e.g. codes of halting TMs). Then

$D^*$ is circular but clearly non-computable (an oracle for

$D^*$ can be used to decide

$R$ ).

— Yuval Filmus

2

@Peter, have you read this answer? It was trying to prove that any circular language (without the condition of regularity) is regular.

— Yuval Filmus

1

@Yuval, my mistake. @chazisop, the pumping lemma is useful for proving non-regularity of languages, but not regularity. (Besides, the assertion of your first sentence reduces to "Every

$s \in L$ of length

$p > 0$ can be written as

$y^i$ where

$y \ne \epsilon$ ", which is clearly false).

— Peter Taylor

1

Yes, I use CIRCULARITY/TM to refer to this. CIRCULARITY/DFA is probably decidable.

— chazisop