Рубин, довольно быстро, но это зависит от ввода
Теперь ускорение в 2 ~ 2,5 раза происходит за счет перехода от строк к целым числам.
Применение:
cat <input> | ruby this.script.rb
Например.
mad_gaksha@madlab ~/tmp $ ruby c50138.rb < c50138.inp2
number of matches: 298208861472
took 0.05726237 s
Количество совпадений для одной маски легко рассчитывается по биномиальному коэффициенту. Так, например, 122020
необходимо 3 2
с заполнены, 1 0
и 2 1
. Таким образом, есть nCr(3,2)=nCr(3,1)=3!/(2!*1!)=3
разные двоичные строки, соответствующие этой маске.
Пересечение между n масками m_1, m_2, ... m_n является маской q, так что двоичная строка s соответствует q только тогда, когда она соответствует всем маскам m_i.
Если взять две маски m_1 и m_2, их пересечение легко вычисляется. Просто установите m_1 [i] = m_2 [i], если m_1 [i] == 2. Пересечение между 122020
и 111222
является 111020
:
122020 (matched by 3 strings, 111000 110010 101010)
111222 (matched by 1 string, 111000)
111020 (matched by 1 string, 111000)
Две отдельные маски соответствуют 3 + 1 = 4 строкам, маска пересечения соответствует одной строке, таким образом, есть 3 + 1-1 = 3 уникальных строки, соответствующих одной или обеим маскам.
Я назову N (m_1, m_2, ...) количество строк, соответствующих всем m_i. Применяя ту же логику, что и выше, мы можем вычислить количество уникальных строк, сопоставленных хотя бы с одной маской, заданной принципом исключения включения, и также см. Ниже, например, так:
N(m_1) + N(m_2) + ... + N(m_n) - N(m_1,m_2) - ... - N(m_n-1,m_n) + N(m_1,m_2,m_3) + N(m_1,m_2,m_4) + ... N(m_n-2,m_n-1,m_n) - N(m_1,m_2,m_3,m_4) -+ ...
Есть много, много, много комбинаций взятия, скажем, 30 масок из 200.
Таким образом, это решение предполагает, что существует не так много пересечений высших порядков входных масок, т.е. большинство n-кортежей с n> 2 масками не будут иметь общих совпадений.
Используйте код здесь, код в ideone может быть устаревшим.
Я добавил функцию, remove_duplicates
которую можно использовать для предварительной обработки ввода и удаления масок m_i
, чтобы все соответствующие ему строки также соответствовали другой маске m_j
. Для текущего ввода это на самом деле занимает больше времени, поскольку таких масок нет (или их не много). , так что функция не применяется к данным еще в коде ниже.
Код:
# factorial table
FAC = [1]
def gen_fac(n)
n.times do |i|
FAC << FAC[i]*(i+1)
end
end
# generates a mask such that it is matched by each string that matches m and n
def diff_mask(m,n)
(0..m.size-1).map do |i|
c1 = m[i]
c2 = n[i]
c1^c2==1 ? break : c1&c2
end
end
# counts the number of possible balanced strings matching the mask
def count_mask(m)
n = m.size/2
c0 = n-m.count(0)
c1 = n-m.count(1)
if c0<0 || c1<0
0
else
FAC[c0+c1]/(FAC[c0]*FAC[c1])
end
end
# removes masks contained in another
def remove_duplicates(m)
m.each do |x|
s = x.join
m.delete_if do |y|
r = /\A#{s.gsub(?3,?.)}\Z/
(!x.equal?(y) && y =~ r) ? true : false
end
end
end
#intersection masks of cn masks from m.size masks
def mask_diff_combinations(m,n=1,s=m.size,diff1=[3]*m[0].size,j=-1,&b)
(j+1..s-1).each do |i|
diff2 = diff_mask(diff1,m[i])
if diff2
mask_diff_combinations(m,n+1,s,diff2,i,&b) if n<s
yield diff2,n
end
end
end
# counts the number of balanced strings matched by at least one mask
def count_n_masks(m)
sum = 0
mask_diff_combinations(m) do |mask,i|
sum += i%2==1 ? count_mask(mask) : -count_mask(mask)
end
sum
end
time = Time.now
# parse input
d = STDIN.each_line.map do |line|
line.chomp.strip.gsub('2','3')
end
d.delete_if(&:empty?)
d.shift
d.map!{|x|x.chars.map(&:to_i)}
# generate factorial table
gen_fac([d.size,d[0].size].max+1)
# count masks
puts "number of matches: #{count_n_masks(d)}"
puts "took #{Time.now-time} s"
Это называется принципом исключения включения, но до того, как кто-то указал мне на это, у меня было собственное доказательство, так что вот так. Делать что-то самостоятельно - это здорово.
Давайте рассмотрим случай 2 масок, звоните потом 0
и 1
, во-первых. Мы берем каждую сбалансированную двоичную строку и классифицируем ее в зависимости от того, к какой маске она подходит. c0
Число тех , которые соответствуют лишь маскируют 0
, c1
Nunber из тех , которые соответствуют только 1
, c01
те , что маски матч 0
и 1
.
Позвольте s0
быть число сумма количества совпадений для каждой маски (они могут перекрываться). Позвольте s1
быть сумма количества совпадений для каждой пары (2-комбинация) масок. Позвольте s_i
быть сумма количества совпадений для каждой (я + 1) комбинации масок. Количество совпадений n-масок - это количество двоичных строк, соответствующих всем маскам.
Если существует n масок, желаемый результат является суммой всех c
, т.е. c = c0+...+cn+c01+c02+...+c(n-2)(n-1)+c012+...+c(n-3)(n-2)(n-1)+...+c0123...(n-2)(n-1)
, То, что программа вычисляет, является чередующейся суммой всех s
, т.е. s = s_0-s_1+s_2-+...+-s_(n-1)
, Мы хотим доказать это s==c
.
п = 1 очевидно. Рассмотрим n = 2. Подсчет всех совпадений по маске 0
дает c0+c01
(количество строк, совпадающих только с 0 + совпадающих с обоими 0
и 1
), подсчитывая все совпадения по 1
маскам c1+c02
. Мы можем проиллюстрировать это следующим образом:
0: c0 c01
1: c1 c10
По определению s0 = c0 + c1 + c12
. s1
сумма совпадений каждой 2-комбинации [0,1]
, т.е. все uniqye c_ij
с. Имейте это в виду c01=c10
.
s0 = c0 + c1 + 2 c01
s1 = c01
s = s0 - s1 = c0 + c1 + c01 = c
Таким образом, s=c
для n = 2.
Теперь рассмотрим n = 3.
0 : c0 + c01 + c02 + c012
1 : c1 + c01 + c12 + c012
2 : c2 + c12 + c02 + c012
01 : c01 + c012
02 : c02 + c012
12 : c12 + c012
012: c012
s0 = c0 + c1 + c2 + 2 (c01+c02+c03) + 3 c012
s1 = c01 + c02 + c12 + 3 c012
s2 = c012
s0 = c__0 + 2 c__1 + 3 c__2
s1 = c__1 + 3 c__2
s2 = c__2
s = s0 - s1 + s2 = ... = c0 + c1 + c2 + c01 + c02 + c03 + c012 = c__0 + c__1 + c__2 = c
Таким образом, s=c
для n = 3. c__i
представляет все c
s с (i + 1) индексами, например, c__1 = c01
для n = 2 и c__1 = c01 + c02 + c12
для n == 3.
Для n = 4 шаблон начинает появляться:
0: c0 + c01 + c02 + c03 + c012 + c013 + c023 + c0123
1: c1 + c01 + c12 + c13 + c102 + c103 + c123 + c0123
2: c2 + c02 + c12 + c23 + c201 + c203 + c213 + c0123
3: c3 + c03 + c13 + c23 + c301 + c302 + c312 + c0123
01: c01 + c012 + c013 + c0123
02: c02 + c012 + c023 + c0123
03: c03 + c013 + c023 + c0123
12: c11 + c012 + c123 + c0123
13: c13 + c013 + c123 + c0123
23: c23 + c023 + c123 + c0123
012: c012 + c0123
013: c013 + c0123
023: c023 + c0123
123: c123 + c0123
0123: c0123
s0 = c__0 + 2 c__1 + 3 c__2 + 4 c__3
s1 = c__1 + 3 c__2 + 6 c__3
s2 = c__2 + 4 c__3
s3 = c__3
s = s0 - s1 + s2 - s3 = c__0 + c__1 + c__2 + c__3 = c
Таким образом, s==c
для n = 4.
В общем, мы получаем биномиальные коэффициенты, подобные этому (↓ это i, → это j):
0 1 2 3 4 5 6 . . .
0 1 2 3 4 5 6 7 . . .
1 1 3 6 10 15 21 . . .
2 1 4 10 20 35 . . .
3 1 5 15 35 . . .
4 1 6 21 . . .
5 1 7 . . .
6 1 . . .
. .
. .
. .
Чтобы увидеть это, рассмотрим, что для некоторых i
и j
есть:
- x = ncr (n, i + 1): комбинации C для пересечения маски (i + 1) из n
- y = ncr (ni-1, ji): для каждой комбинации C выше есть y различных комбинаций для пересечения масок (j + 2) из тех, которые содержат C
- z = ncr (n, j + 1): различные комбинации для пересечения масок (j + 1) из n
Как это может показаться запутанным, вот определение, примененное к примеру. Для i = 1, j = 2, n = 4 это выглядит так (см. Выше):
01: c01 + c012 + c013 + c0123
02: c02 + c012 + c023 + c0123
03: c03 + c013 + c023 + c0123
12: c11 + c012 + c123 + c0123
13: c13 + c013 + c123 + c0123
23: c23 + c023 + c123 + c0123
Так что здесь x = 6 (01, 02, 03, 12, 13, 23), y = 2 (два c с тремя индексами для каждой комбинации), z = 4 (c012, c013, c023, c123).
В общем, есть x*y
коэффициенты c
с (j + 1) индексами, и есть z
разные, поэтому каждый x*y/z
раз встречается , что мы называем коэффициентом k_ij
. По простой алгебре получаем k_ij = ncr(n,i+1) ncr(n-i-1,j-i) / ncr(n,j+1) = ncr(j+1,i+1)
.
Таким образом, индекс дается выражением: k_ij = nCr(j+1,i+1)
Если вы помните все определения, все, что нам нужно показать, это то, что переменная сумма каждого столбца дает 1.
Таким образом, переменная сумма s0 - s1 + s2 - s3 +- ... +- s(n-1)
может быть выражена как:
s_j = c__j * ∑[(-1)^(i+j) k_ij] for i=0..n-1
= c__j * ∑[(-1)^(i+j) nCr(j+1,i+1)] for i=0..n-1
= c__j * ∑[(-1)^(i+j) nCr(j+1,i)]{i=0..n} - (-1)^0 nCr(j+1,0)
= (-1)^j c__j
s = ∑[(-1)^j s_j] for j = 0..n-1
= ∑[(-1)^j (-1)^j c__j)] for j=0..n-1
= ∑[c__j] for j=0..n-1
= c
Таким образом, s=c
для всех n = 1,2,3, ...