Нимрод: ~ 38 667 (580 000 000/15 000)
Этот ответ использует довольно простой подход. В коде используется простое сито простых чисел, которое хранит простое число наименьшей простой степени в каждом слоте для составных чисел (ноль для простых чисел), затем использует динамическое программирование для построения функции-накопителя в том же диапазоне, а затем суммирует результаты. Программа тратит практически все свое время на создание сита, а затем вычисляет суммарную функцию за долю времени. Похоже, все сводится к созданию эффективного сита (с небольшим уклоном в то, что нужно также уметь извлекать из результата главный фактор для составных чисел и поддерживать разумное использование памяти).
Обновление: улучшена производительность за счет уменьшения объема памяти и улучшения поведения кэша. Можно выжать на 5-10% больше производительности, но увеличение сложности кода того не стоит. В конечном счете, этот алгоритм в первую очередь использует узкое место ЦП фон Неймана, и существует очень мало алгоритмических настроек, которые могут обойти это.
Также обновлен делитель производительности, так как код C ++ не предназначался для компиляции со всеми оптимизациями, и никто другой не делал этого. :)
Обновление 2: оптимизирована работа сита для улучшения доступа к памяти. Теперь обрабатывайте небольшие простые числа с помощью memcpy () (~ 5% ускорения) и пропускайте кратные 2, 3 и 5 при просеивании больших простых чисел (~ 10% ускорения).
Код C ++: 9,9 секунды (с g ++ 4,9)
Код Nimrod: 9,9 секунды (с -d: release, бэкэнд gcc 4.9)
proc handleSmallPrimes(sieve: var openarray[int32], m: int) =
# Small primes are handled as a special case through what is ideally
# the system's highly optimized memcpy() routine.
let k = 2*3*5*7*11*13*17
var sp = newSeq[int32](k div 2)
for i in [3,5,7,11,13,17]:
for j in countup(i, k, 2*i):
sp[j div 2] = int32(i)
for i in countup(0, sieve.high, len(sp)):
if i + len(sp) <= len(sieve):
copyMem(addr(sieve[i]), addr(sp[0]), sizeof(int32)*len(sp))
else:
copyMem(addr(sieve[i]), addr(sp[0]), sizeof(int32)*(len(sieve)-i))
# Fixing up the numbers for values that are actually prime.
for i in [3,5,7,11,13,17]:
sieve[i div 2] = 0
proc constructSieve(m: int): seq[int32] =
result = newSeq[int32](m div 2 + 1)
handleSmallPrimes(result, m)
var i = 19
# Having handled small primes, we only consider candidates for
# composite numbers that are relatively prime with 31. This cuts
# their number almost in half.
let steps = [ 1, 7, 11, 13, 17, 19, 23, 29, 31 ]
var isteps: array[8, int]
while i * i <= m:
if result[i div 2] == 0:
for j in 0..7: isteps[j] = i*(steps[j+1]-steps[j])
var k = 1 # second entry in "steps mod 30" list.
var j = 7*i
while j <= m:
result[j div 2] = int32(i)
j += isteps[k]
k = (k + 1) and 7 # "mod 30" list has eight elements.
i += 2
proc calculateAndSumTotients(sieve: var openarray[int32], n: int): int =
result = 1
for i in 2'i32..int32(n):
var tot: int32
if (i and 1) == 0:
var m = i div 2
var pp: int32 = 2
while (m and 1) == 0:
pp *= 2
m = m div 2
if m == 1:
tot = pp div 2
else:
tot = (pp div 2) * sieve[m div 2]
elif sieve[i div 2] == 0: # prime?
tot = i - 1
sieve[i div 2] = tot
else:
# find and extract the first prime power pp.
# It's relatively prime with i/pp.
var p = sieve[i div 2]
var m = i div p
var pp = p
while m mod p == 0 and m != p:
pp *= p
m = m div p
if m == p: # is i a prime power?
tot = pp*(p-1)
else:
tot = sieve[pp div 2] * sieve[m div 2]
sieve[i div 2] = tot
result += tot
proc main(n: int) =
var sieve = constructSieve(n)
let totSum = calculateAndSumTotients(sieve, n)
echo totSum
main(580_000_000)