Я ищу способ проверить, повторяется ли данная строка для всей строки или нет.
Примеры:
[
'0045662100456621004566210045662100456621', # '00456621'
'0072992700729927007299270072992700729927', # '00729927'
'001443001443001443001443001443001443001443', # '001443'
'037037037037037037037037037037037037037037037', # '037'
'047619047619047619047619047619047619047619', # '047619'
'002457002457002457002457002457002457002457', # '002457'
'001221001221001221001221001221001221001221', # '001221'
'001230012300123001230012300123001230012300123', # '00123'
'0013947001394700139470013947001394700139470013947', # '0013947'
'001001001001001001001001001001001001001001001001001', # '001'
'001406469760900140646976090014064697609', # '0014064697609'
]
являются строками, которые повторяются, и
[
'004608294930875576036866359447',
'00469483568075117370892018779342723',
'004739336492890995260663507109',
'001508295625942684766214177978883861236802413273',
'007518796992481203',
'0071942446043165467625899280575539568345323741',
'0434782608695652173913',
'0344827586206896551724137931',
'002481389578163771712158808933',
'002932551319648093841642228739',
'0035587188612099644128113879',
'003484320557491289198606271777',
'00115074798619102416570771',
]
примеры тех, которые этого не делают.
Повторяющиеся фрагменты строк, которые мне даны, могут быть довольно длинными, а сами строки могут содержать 500 или более символов, поэтому циклически проходя по каждому символу, пытаясь построить шаблон, затем проверяя шаблон по сравнению с остальной строкой, кажется ужасно медленным. Умножьте это на потенциально сотни строк, и я не вижу никакого интуитивного решения.
Я немного изучил регулярные выражения, и они кажутся полезными, когда вы знаете, что ищете, или, по крайней мере, длину шаблона, который ищете. К сожалению, я не знаю ни того, ни другого.
Как я могу определить, является ли строка повторяющейся, и если это так, какова самая короткая повторяющаяся подпоследовательность?