Быстрая и точная реализация неполной гамма-функции с двойной точностью

10

Каков современный способ реализации специальных функций двойной точности? Мне нужен следующий интеграл: для и , что можно записать в терминах нижней неполной гамма-функции. Вот моя реализация на Фортране и Си:

F_{м} (T) знак равно \int_{0}^{1} U^{2 м} е^{- T U^{2}} d U знак равно \frac{γ (м + \frac{1}{2}, T)}{2 T^{м + \frac{1}{2}}}

$F_m(t) = \int_0^1 u^{2m} e^{-tu^2} d u = {\gamma(m+{1\over 2}, t)\over 2 t^{m+{1\over 2}}}$

m = 0, 1, 2, . . .

$m=0, 1, 2, ...$

t > 0

$t>0$

https://gist.github.com/3764427

который использует последовательное расширение, суммирует термины до заданной точности, а затем использует рекурсивные соотношения для эффективного получения значений для меньшего . Я хорошо это проверил, и я получаю точность 1e-15 для всех значений параметров, которые мне нужны, подробности см. В комментариях к версии на Fortran. $m$

Есть ли лучший способ реализовать это? Вот реализация гамма-функции в gfortran:

https://github.com/mirrors/gcc/blob/master/libgfortran/intrinsics/c99_functions.c#L1781

это приближение рациональной функции вместо суммирования некоторого бесконечного ряда, который я делаю. Я думаю, что это лучший подход, потому что нужно получить одинаковую точность. Есть ли какой-то канонический подход к этим вещам, или нужно придумать специальный алгоритм для каждой специальной функции?

Обновление 1 :

Основываясь на комментариях, вот реализация с использованием SLATEC:

https://gist.github.com/3767621

он воспроизводит значения из моей собственной функции, примерно на уровне точности 1e-15. Однако я заметил проблему, заключающуюся в том, что для t = 1e-6 и m = 50 член становится равным 1e-303, а для более высоких «m» он просто начинает давать неправильные ответы. У моей функции нет этой проблемы, потому что я использую отношения расширения / повторения ряда непосредственно для . Вот пример правильного значения: $t^{m+{1\over2}}$ $F_m$

$F_{100}$ (1e-6)=4.97511945200351715E-003 ,

но я не могу получить это, используя SLATEC, потому что знаменатель взрывается. Как видите, фактическое значение хорошее и маленькое. $F_m$

Обновление 2 :

Чтобы избежать вышеупомянутой проблемы, можно использовать функцию dgamit(неполная гамма-функция Трикоми), то F(m, t) = dgamit(m+0.5_dp, t) * gamma(m+0.5_dp) / 2есть проблем с больше нет, но, к сожалению, взрывы для . Это , однако , может быть достаточно высокими для моих целей. $t$ gamma(m+0.5_dp) $m\approx 172$ $m$

efficiency accuracy special-functions

— Ондржей Чертик
источник

2

Зачем кодировать свою собственную функцию? GSL, cephes и SLATEC все это реализуют.

— Джефф Оксберри

Я обновил вопрос, почему я не использую SLATEC.

— Ондржей Чертик

@ OndřejČertík Вы обнаружили ошибку! Проголосовал твой вопрос!

— Али

Али --- это не ошибка в SLATEC, но в том факте, что мне действительно нужно разделить на , чтобы получить значение для . Таким образом, численный метод, который работает для может не очень хорошо работать для .

γ (z, x)

$\gamma(z, x)$

t^{m + \frac{1}{2}}

$t^{m+{1\over2}}$

F_{m} (t)

$F_m(t)$

γ (z, x)

$\gamma(z, x)$

F_{m} (t)

$F_m(t)$

— Ондржей Чертик

@ OndřejČertík Хорошо, извините, моя ошибка, я не проверял ваш код, прежде чем сделать свой комментарий.

— Али

9

Рассматриваемый интеграл также известен как функция Бойса, в честь британского химика Сэмюэля Фрэнсиса Бойса, который ввел его использование в начале 1950-х годов. Несколько лет назад мне нужно было вычислить эту функцию с двойной точностью, максимально быстро, но точно. Мне удалось добиться относительной ошибки порядка во всем входном домене. $10^{-15}$

Как правило, выгодно использовать разные приближения для малых и больших аргументов, где оптимальное переключение между «большим» и «малым» лучше всего определяется экспериментально и, как правило, является функцией от . Для моего кода я определил «маленькие» аргументы как те, которые удовлетворяют условию . $m$ $a \le m + 1{1\over 2}$

Для больших аргументов я вычисляю

F_{м} (a) знак равно \frac{1}{2} γ (м + \frac{1}{2}, a) \times п \times п, п знак равно a^{- \frac{1}{2} (м + \frac{1}{2})}

$\mathrm{F}_m(a) = {1\over 2}\gamma\left(m + {1\over 2}, a\right) \times p \times p, \space \space p = a^{-{1\over 2}\left(m+ {1\over 2}\right)}$

Этот порядок операций позволяет избежать преждевременного снижения нагрузки. Поскольку нам нужна только нижняя неполная гамма-функция из полуцелых порядков, а не полностью общая нижняя неполная гамма-функция, с точки зрения производительности выгодно вычислять

γ (м + \frac{1}{2}, a) знак равно Γ (м + \frac{1}{2}) - Γ (м + \frac{1}{2}, a)

$\gamma \left(m + {1\over 2}, a\right) = \Gamma \left(m + {1\over 2}\right) - \Gamma\left(m + {1\over 2}, a\right)$

используя табличные значения и вычисляя соответствии с этим ответом , тщательно избегая проблемы вычитания отмены посредством использования слитой операции умножения-сложения. Потенциальная дальнейшая оптимизация состоит в том, чтобы наблюдать, что для достаточно больших , с точностью до заданная точность с плавающей точкой. $\Gamma \left(m + {1\over 2}\right)$ $\Gamma\left(m + {1\over 2}, a\right)$ $a$ $\gamma \left(m + {1\over 2}, a\right) = \Gamma \left(m + {1\over 2}\right)$

Для небольших аргументов я начал с разложения в ряд для нижней неполной гамма-функции из

А. Эрдельи, В. Магнус, Ф. Оберхеттингер и Ф. Г. Трикоми, "Высшие трансцендентные функции, том 2". Нью-Йорк, Нью-Йорк: Макгроу-Хилл, 1953

и изменил его, чтобы вычислить функцию Бойса следующим образом (усечение ряда, когда член достаточно мал для заданной точности): $\mathrm{F}_{m}(a)$

F_{м} (a) знак равно \frac{1}{2} \frac{1}{м + \frac{1}{2}} ехр (- a) (1 + Σ_{N знак равно 1}^{\infty} \frac{a^{N}}{(1 + м + \frac{1}{2}) \times,,, \times (N + м + \frac{1}{2})})

$\mathrm{F}_{m}(a) = {1\over 2}\frac{1}{m + {1\over 2}}\exp(-a)\left(1+\sum_{n=1}^{\infty}\frac{a^{n}}{(1 + m + {1\over 2}) \times\space ...\space \times (n + m + {1\over 2})}\right)$

Существуют также интересные и потенциально важные частные случаи для младших порядков функции Бойса, особенно . Во-первых, у нас есть , где - это функция ошибок, предоставляемая в Fortran 2008 в качестве элементарной функции и в C / C ++ в качестве стандартных функций библиотеки и . $m = 0, 1, 2, 3$ $\mathrm{F}_{0}(a) = \sqrt{\frac{\pi}{4a}}\mathrm{erf}\left(\sqrt{a}\right)$ $\mathrm{erf}$ ERFerferff

Для быстрых вычислений, когда , я использую собственные минимаксные полиномиальные приближения для небольших аргументов, скажем , и прямую рекурсию , для больших где проблемы с вычитающей отменой в последнем случае уменьшаются путем использования слитых операций умножения-сложения. $m = 1, 2, 3$ $a \lt {2{1\over 2}}$ $\mathrm{F}_{m}(a) = \frac{1}{2a}\left(\left(2m-1\right)\mathrm{F}_{m-1}(a) - \exp(-a)\right)$

В тех случаях, когда значения функции должны быть вычислены для заданного значения по нескольким порядкам , можно вычислить значение функции непосредственно для самого высокого значения , т. Е. Как обсуждалось выше, а затем использовать численно устойчивую обратную рекурсию для вычисления все остальные значения функций. $a$ $m$ $m$ $\mathrm{F}_{m-1} = \frac{1}{2m-1} \left(2a \space \mathrm{F}_{m}(a) + \exp\left(-a\right)\right)$

— njuffa
источник

Спасибо @njuffa за отличный ответ. Если вы создадите свой код для этого открытого исходного кода, я думаю, что это будет очень полезно для многих людей.

— Ондржей Чертик,

1

В настоящее время реализация описанного алгоритма в CUDA доступна для бесплатной загрузки с сайта разработчика NVIDIA (требуется бесплатная регистрация в качестве разработчика CUDA, одобрение обычно в течение одного рабочего дня). Код находится под лицензией BSD, которая должна быть совместима практически с любым проектом.

— njuffa

5

Вы можете взглянуть на Численные методы для специальных функций Ампаро Гила, Хавьера Сегуры и Нико М. Темме.

— Джон Д. Кук
источник

Это отличная книга, спасибо за совет!

— Ондржей Чертик

4

Я бы взглянул на книгу Абрамовича и Стегуна, или на новую редакцию, опубликованную NIST пару лет назад, и я думаю, что она доступна онлайн. Они также обсуждают способы стабильной реализации вещей.

— Вольфганг Бангерт
источник

Я использовал это: dlmf.nist.gov/8 , при его реализации, но это, вероятно, другой ресурс. Глава 5 «Числовые рецепты» также содержит интересную информацию, но применима только к функциям одной переменной.

— Ондржей Чертик

Я не думаю, что вы найдете что-то намного более свежее, чем их справка 2001 года; SLATEC будет старше этого.

— Джефф Оксберри

1

Похоже, это не современно, но SLATEC в Netlib предлагает «1400 общих математических и статистических процедур». Неполная гамма доступна по специальным функциям здесь .

Реализация таких функций занимает много времени и подвержена ошибкам, поэтому я бы не стал делать это сам, если бы в этом не было крайней необходимости. SLATEC существует уже довольно давно и широко используется, по крайней мере, на основе количества загрузок , поэтому я ожидаю, что реализация будет зрелой.

— Али
источник