Недавно я узнал о гипотезе Жадности о самой короткой проблеме суперструн .
В этой задаче нам дан набор строк и мы хотим найти самую короткую суперструну то есть такую, чтобы каждая как подстрока .
Эта задача является NP-трудной, и после длинной серии работ наиболее известный алгоритм приближения для этой задачи имеет отношение [Paluch '14].
На практике биологи используют следующий алгоритм Жадности:
На каждом шаге объединяйте две строки, которые имеют максимальное перекрытие по всем парам (максимальный суффикс, который является префиксом другой строки), и повторяйте для этого нового экземпляра, пока не останется только одна строка (которая является суперструной всех входных строк). )
Нижнюю границу в отношении аппроксимации этого алгоритма жадности можно получить из входных данных .
Интересно, что это было предположено, что это худший пример, то есть, что Жадность достигает аппроксимации для самой короткой проблемы суперструн. Я был очень удивлен, увидев, что такой естественный и простой алгоритм так сложно анализировать.
Есть ли интуиция, факты, наблюдения, примеры, которые указывают на то, почему этот вопрос так сложен?