Обтекание подпоследовательностей


11

Вступление

В этой задаче ваша задача - найти обобщенные подпоследовательности строк. Подпоследовательности не обязательно являются смежными, и они также могут «обвивать» строку, проходя через ее конец и начиная снова с начала. Вы хотите минимизировать количество оберток, хотя.

Более формально, пусть uи vбудут любые две строки и k ≥ 0целое число. Мы говорим , что uэто k-упаковочная и дозирующая подпоследовательность из v, если существует различные показатели , такие , что и в большинстве индексов удовлетворяют . Это означает, что его можно найти внутри , перейдя слева направо, выбрав некоторые из его символов в пути и обернувшись вокруг в большинстве случаев (эквивалентно, выполняя самое большее размах ). Обратите внимание, что ни один символ не может быть выбран более одного раза, даже после переноса , и что подпоследовательности обтекания - это в точности обычные подпоследовательности, с которыми мы все знакомы.i1, i2, ..., ilen(u)u == v[i1] v[i2] ... v[ilen(u)]kijij > ij+1uvkk+1v0

Задание

Ваши входные данные представляют собой две непустые буквенно-цифровые строки uи v, а ваши выходные данные представляют собой наименьшее целое число k, которое uявляется kподпоследовательностью -wrapping v. Если такого не kсуществует, вывод должен быть -1.

пример

Рассмотрим входы u := xyzyxzzxyxи v := yxzzazzyxxxyz. Если мы начнем искать персонажей uв vжадной манере, мы обернемся 3 раза:

 yxzzazzyxxxyz
>─x─────y────z┐
┌─────────────┘
└y───────x────┐
┌─────────────┘
└──zz─────x─y─┐
┌─────────────┘
└──────────x──>

Таким образом, правильный вывод - максимум 3. Обратите внимание, как крайний левый символ xвыбирается один раз, а затем игнорируется во втором цикле, поскольку его нельзя использовать повторно. Тем не менее, существует более короткий метод только с двумя переходами:

 yxzzazzyxxxyz
>──────────xyz┐
┌─────────────┘
└yxzz────x────┐
┌─────────────┘
└───────y─x───>

Оказывается, одного обхода (то есть двух циклов) недостаточно, поэтому правильный вывод получен 2.

Правила и бонусы

Вы можете написать либо функцию, либо полную программу, а также при необходимости изменить порядок входных данных. Побеждает меньшее количество байтов, и стандартные лазейки запрещены.

Существует бонус -10% для вычисления всех тестовых случаев менее чем за 10 секунд. Я буду проверять неясные случаи на моей машине; моя эталонная реализация в Python занимает около 0,6 секунд. У меня есть 7-летний ноутбук с двухъядерным процессором 1,86 ГГц, который вы можете принять во внимание.

Тестовые случаи

"me" "moe" -> 0
"meet" "metro" -> -1
"ababa" "abaab" -> 1
"abaab" "baabaa" -> 1
"1c1C1C2B" "1111CCCcB2" -> 3
"reverse" "reserved" -> 2
"abcdefg" "gfedcba" -> 6
"xyzyxzzxyx" "yxzzazzyxxxyz" -> 2
"aasdffdaasdf" "asdfddasdfsdaafsds" -> 2

1
Будет ли это также правильным решением для примера? Это жадный подход.
orlp

@orlp Недопустимо, потому что первый xиспользуется в трех различных циклах. Он может быть использован только один раз.
Згарб

Аааа, теперь я вижу.
orlp

Ответы:


4

Pyth, 34 байта

Mh+Smssm>.ukC,dtdfqGsm@HkT.PUHlG_1

Это определяет функцию g, которая принимает две строки в качестве параметра. Попробуйте онлайн: Pyth Compiler / Executor

Этот код очень неэффективен. Это имеет время и сложность памяти len(v)!/(len(v)-len(u))!. Он не может решить более длинные тестовые случаи менее чем за 10 секунд. (Это также может произойти сбой, так как не хватит памяти.)

M                                    define g(G, H): return _
                          .PUHlG        all permutations of [0, 1, ..., len(H)-1] of length len(G)
                 fqGsm@HkT              filter the permutations which form the string G
    mssm>.ukC,dtd                       compute the number of wraps for each of the remaining permutations
  +S                            _1      sort the numbers and append -1
 h                                      return the first element

4

Haskell, 160 * 0,9 = 144 байта

a#(-1)=a
a#b=min a b
f y=w(y++" ")0$length y
w _ n _[]=n
w(c:d)n o g@(a:b)|n>o=(-1)|a==c=z#w y n z g|c==' '=w y(n+1)o g|1<2=w y n o g where z=w d n o b;y=d++[c]

Время для всех тестовых случаев (примечание: аргументы перевернуты):

*Main> map (uncurry f) [
             ("moe", "me"),
             ("metro", "meet"),
             ("abaab", "ababa"),
             ("baabaa", "abaab"),
             ("1111CCCcB2", "1c1C1C2B"),
             ("reserved", "reverse"),
             ("gfedcba", "abcdefg"),
             ("yxzzazzyxxxyz", "xyzyxzzxyx"),
             ("asdfddasdfsdaafsds", "aasdffdaasdf")]
[0,-1,1,1,3,2,6,2,2]
(0.08 secs, 25794240 bytes)

Как это работает (короткая версия): простая грубая сила, которая требует минимум использования соответствующего символа и пропускает его. Я прекращаю поиск по окончании (возвращая количество циклов) или когда количество циклов больше, чем минимальное (возвращая -1).

По сравнению с моей первой версией сэкономлено много байтов, в основном потому, что я перешел с полной программы на функцию.

С некоторыми комментариями и надлежащим интервалом в гольф Haskell вполне читабелен:

-- a minimum function that ignores a -1 in the right argument to prevent
-- "not solvable" cases in parts of the recursive search to dominate low numbers
-- of solvable parts. If the case isn't solvabale at all, both arguments are
-- -1 and are carried on.
a # (-1) = a
a # b    = min a b

-- the main function f calls the worker funktion w with arguments
-- * the string to search in (STSI), appended by a space to detect cycles
-- * the number of cycles so far
-- * the minimum of cycles needed so far, starting with the length of STSI
-- * the string to search for (STSF) (partial applied away and therefore invisible)
f y = w (y++" ") 0 (length y)

-- the worker function 
w _ n _ [] = n          -- base case: if STSF is empty the work is done and the 
                        -- number of cycles is returned

w (c:d) n o g@(a:b)     -- "c" is first char of STSI, "d" the rest
                        -- "n" number of cycles, "o" minimum of cycles so far
                        -- "g" is the whole STSF, "a" the 1st char, "b" the rest
  | n>o    = (-1)             -- if current cycle is more than a previous result,
                              -- indicate failure
  | a==c   = z # w y n z g    -- if there's a character match, take the min of
                              -- using it and skipping it
  | c==' ' = w y (n+1) o g    -- cycle detected, repeat and adjust n
  | 1<2    = w y n o g        -- otherwise try next char in STSI

  where                 -- just some golfing: short names for common subexpressions
  z = w d n o b;        -- number of cycles if a matching char is used
  y = d ++ [c]          -- rotated STSI

Для справки: старая версия, полная программа, 187 байт

main=interact$show.f.lines
a#(-1)=a
a#b=min a b
f[x,y]=w x(y++" ")0 0
w[]_ n _=n
w g@(a:b)(c:d)n m|a==c=w b d n 1#y|c==' '&&m==1=w g(d++" ")(n+1)0|c==' '=(-1)|1<2=y where y=w g(d++[c])n m

@Zgarb: переработал мое решение. Теперь быстрее и короче.
Ними

Работает в 0,6 с при интерпретации, 0,01 с при компиляции.
Згарб

2

JavaScript (ES6) 174 (193 - 10%)

Рекурсивный поиск, как и ответ @ nimi, сохраняющий минимум оберток. Пространство решений велико (прежде всего, в последнем примере), но сокращение поиска до минимума, найденного в данный момент, сокращает время. Редактировать 1 Добавить отсутствующий тестовый пример, немного укороченный Редактировать 2 Нет необходимости передавать параметр w вокруг, это исправлено

K=(w,s,x)=>
  ~-(R=(r,l,p=0,q=1,z=w[p],i=0)=>
  {
    if(z&&!(q>x)){
      if(~(r+l).indexOf(z))
        for(t=l?R(l+r,'',p,q+1):x;x<t?0:x=t,i=~r.indexOf(z,-i);)
          t=R(r.slice(-i),l+r.slice(0,~i),p+1,q);
      q=x
    }
    return q
  })(s,'')

Ungolfed

K=(word, astring)=>
{
  var minWraps // undefined at first. All numeric comparison with undefined give false 
  var R=(right, left, pos, wraps)=>
  {
    var cur = word[pos]
    var i,t;
    if (! cur) // when all chars of word are managed
      return wraps;
    if (wraps > minWraps) // over the minimum wrap count already found, stop search
      return wraps; 
    if ( (right+left).indexOf(cur) < 0 ) // if the current char is not found in the remaining part of the string
      return minWraps; // return the current min, could still be undefined (that means 'no way')
    if ( left ) // if there is a left part, try a wrapping search with the current char
    {
      t = R(left+right, '', pos, wraps+1)
      if ( !(minWraps < t)) minWraps = t; // set current min if t is less than current min or current min is still undefined
    }
    // find all occurrences of current char in the remaining part
    // for each occurrence, start a recursive search for the next char
    for(i = 0; (i = right.indexOf(cur, i)) >= 0; i++)
    {
      var passed = right.slice(0,i) // the passed chars go in the left part
      var rest = right.slice(i+1) 
      t = R(rest, left+passed, pos+1, wraps) // try next char in the remaining part, no wrap
      if ( !(minWraps < t)) minWraps = t; // set current min if t is less than current min or current min is still undefined
    }
    return minWraps
  }
  var result = R(astring, '', 0, 1) // start with right=string and left empty
  return ~-result; // decrement. convert undefined to -1
}

Тест в консоли Firefox / FireBug

time=~new Date;
[['me','moe']
,['meet','metro']
,['ababa','abaab']
,['abaab','baabaa']
,['1c1C1C2B','1111CCCcB2']
,['reverse','reserved']
,['abcdefg','gfedcba']
,['xyzyxzzxyx','yxzzazzyxxxyz']
,['aasdffdaasdf','asdfddasdfsdaafsds']]
.forEach(s=>console.log(s,r=K(...s)))
time-=~new Date

Выход (последняя строка - время выполнения в мс)

["me", "moe"] 0
["meet", "metro"] -1
["ababa", "abaab"] 1
["abaab", "baabaa"] 1
["1c1C1C2B", "1111CCCcB2"] 3
["reverse", "reserved"] 2
["abcdefg", "gfedcba"] 6
["xyzyxzzxyx", "yxzzazzyxxxyz"] 2
["aasdffdaasdf", "asdfddasdfsdaafsds"] 2
116


Протестировано с Firebug, работает в 175 мс на моей машине.
Згарб

@ Zgarb, тогда есть место для улучшений: я постараюсь сделать это медленнее и короче
edc65
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.