Отчет о результатах подгонки кривой в научной статье

(Я надеюсь, что этот вопрос подходит для этого сайта; если нет, примите мои извинения).

Я запустил определенное моделирование и получил временные ряды y (t), t = 0, 1, ... 20. Попробовав некоторые функции, я обнаружил, что:

y(t) =~ 1 / (A t + B)

Где A и B - коэффициенты, которые я рассчитал с использованием линейной регрессии, с R ^ 2> 0,99.

Каков стандартный способ сообщить о таких результатах в научной статье? В частности:

О. У меня нет теоретического объяснения, почему результат выглядит так (я знаю, что он должен уменьшаться, и что он ограничен снизу, но не намного). Это было просто удачное предположение. Должен ли я описать все другие неудачные предположения, которые я пробовал?

B. Всякий раз, когда я запускаю симуляцию, я получаю немного разные значения A и B. Должен ли я просто сообщить о случайном прогоне, или я должен запустить симуляцию много раз и усреднить результаты? Если так, сколько раз достаточно?

regression publications

— Эрель Сегал-Халеви
источник

Что вы хотите передать? Что представляет собой каждая отдельная симуляция?

— Билл Барт

Это симуляция владения землей. Есть N граждан и N земельных участков. Изначально каждый земельный участок отдается случайному гражданину. Затем каждый год каждая земля продается с определенной вероятностью p, и, если она действительно продается, покупатель выбирается случайным образом. Через 50 лет я провожу процедуру «Юбилейный», когда некоторые земли возвращаются первоначальным владельцам, если у этих владельцев в настоящее время нет земли. Я измеряю количество граждан без земли (у) после каждого юбилея (т). Конечно, у (т) не увеличивается. Я хочу показать, что оно снижается с предсказуемой скоростью и что оно сходится к 0.

— Эрел Сегал-Халеви

Мне кажется, что вам следует разработать статистическое представление и (среднее, медианное и т. Д.).

A

$A$

B

$B$

— Билл Барт

Рассмотрим модель с N + 1 различными видами

где

, что обозначает концентрацию землевладельцев с

участками земли. Теперь вы можете применить теорию химической кинетики к вашей проблеме.

x_{n}

$x_n$

n = 0 \dots N

$n=0\dots N$

n

$n$

— Смертельное дыхание

Билл: ты имеешь в виду, что я должен вычислить A и B много раз, а затем сообщить среднее и стандартное? Я думаю, что лучший подход состоит в том, чтобы сделать единственную линейную регрессию со всеми выборками из всех симуляций. Но сколько раз я должен запустить симуляцию?

— Эрель Сегал-Халеви

Ответы:

Вы пытаетесь приспособить степенной закон к своему распределению. Очень интересно. Они все время появляются в теории графов , в социальных сетях и во многих других местах.

Там какие - то учебники по установке данных здесь и здесь .

Кроме того, что касается вопроса А., как вероятность того, что человек купит землю, зависит от того, сколько земли у него уже есть? Возможно, вы сможете использовать модель Барбаси, чтобы объяснить, почему степенной закон соответствует вашим данным.

Обновление: я использовал это, и он прекрасно работает: https://pypi.python.org/pypi/powerlaw

— dranxo
источник

+1 за все ссылки! Я также думал о степенном законе, но его простая форма (y = A t ^ k) не влечет за собой форму, которую я нашел, из-за постоянной B (y = (A t + B) ^ - 1). Есть ли более общая форма?

— Эрл Сегал-Халеви

Если вы заинтересованы в описании формы кривой, то вам следует учесть коэффициент и сдвиг, прежде чем устанавливать степенной закон. Тот факт, что у вас есть B, не имеет отношения к форме кривой.

— Dranxo

Извините, я вас не понял, что вы подразумеваете под "тогда вы должны учитывать и сдвигать"?

— Эрель Сегал-Халеви

Установите x = t + B / A. Тогда (At + B) ^ {- 1} = (A * x) ^ {- 1}, который является формой в ссылках.

— Dranxo

tuvalu.santafe.edu/~aaronc/courses/7000/csci7000-001_2011_L3.pdf

— dranxo

Несколько мыслей по вашему вопросу:

То, как вы сообщите о своей модели, будет очень сильно зависеть от вашей аудитории и вашей области. Например, в моей области статистика подбора моделей, такая как R ^ 2, сообщается очень редко, что не считается ни впечатляющим, ни особенно полезным. Вместо этого, как правило, описываются некоторые критерии того, как вы пришли к модели, к которой пришли, а затем вы сообщаете о результатах вашей модели - мы все предполагаем, что вы на самом деле соответствует модели.
«Я попал через эту форму» - плохое объяснение. Очень плохой. Несмотря на любовь к историям случайного гения, таким как открытие пенициллина или хинина, «слепая тупая удача» не является надежным научным процессом. Например, вы показали, что эта форма хорошо подходит для ваших данных, но вы еще не показали, что она лучше всего подходит для ваших данных. Одного R ^ 2 недостаточно для оценки того, насколько хорошо ваша модель соответствует данным. Смотрите квартет Анскомба .
Как упомянул @rcompton, похоже, что вы пытаетесь приспособить распределение по степенному закону, не зная его, но даже если вам удастся хорошо соответствовать степенному закону, будет действительно лучше, если вы найдете причину, по которой вы думаете, что это степенной закон , Этого может быть достаточно, чтобы составить график Y с течением времени, перейти к CrossValidated (или колледжу / департаменту, более удобному со статистикой) и систематически просматривать распределения, которые могут дать вам примерно такой взгляд. Помимо распределения по степенному закону, есть и другие, которые могут дать вам превосходную форму.

— фомиты
источник

+1 для понимания. «Систематически просматривайте дистрибутивы, которые могут выглядеть примерно так». - где я могу найти это?

— Эрл Сегал-Халеви

@ErelSegalHalevi Вы можете начать с CrossValidated, этого сайта-партнера, который касается статистики и анализа данных.

— Fomite