Как измерить / аргументировать правильность соответствия линии тренда степенному закону?


21

У меня есть некоторые данные, которым я пытаюсь соответствовать линию тренда. Я полагаю, что данные соответствуют степенному закону, и поэтому нанесли данные на оси логарифма в поисках прямой линии. Это привело к (почти) прямой линии, поэтому в Excel я добавил линию тренда для степенного закона. Поскольку я новичок в статистике, мой вопрос в том, каков теперь лучший способ для меня перейти от «хорошо, что линия выглядит так, как будто она хорошо вписывается» в «числовое свойство доказывающее, что этот график соответствует степенному закону»? Икс

В Excel я могу получить значение r-squared, хотя, учитывая мои ограниченные знания статистики, я даже не знаю, действительно ли это подходит для моих конкретных обстоятельств. Я включил изображение ниже, показывающее график данных, с которыми я работаю в Excel. У меня небольшой опыт работы с R, поэтому, если мой анализ ограничен моими инструментами, я открыт для предложений о том, как улучшить его с помощью R.

альтернативный текст


Вы можете найти некоторые идеи здесь freakonometrics.blog.free.fr/index.php?post/2010/09/29/…

Ответы:


24

Смотрите страницу Аарона Клаузета:

в котором есть ссылки на код для подгонки степенных законов (Matlab, R, Python, C ++), а также статья Клаузет и Шализи, которую вы должны прочитать в первую очередь.

Возможно, вы захотите сначала прочитать записи блога Клаусета и Шализи на бумаге:

Резюме последней ссылки может быть:

  • Множество распределений дают вам прямые линии на графике log-log.

  • Злоупотребление линейной регрессией заставляет ребенка Гаусса плакать.
    Подгонка линии к вашему бревенчатому графику методом наименьших квадратов - плохая идея.

  • Используйте максимальную вероятность для оценки показателя масштабирования.
  • Используйте оценку соответствия, чтобы оценить, где начинается область масштабирования.
  • Используйте тест на пригодность, чтобы проверить, подходит ли он.
  • Используйте тест Вуонга, чтобы проверить альтернативы, и будьте готовы к разочарованию.

1
Я второй это. Есть много примеров чего-то, что выглядело как степенной закон, но при более строгом рассмотрении оказалось, что это не .... и нет, высокого значения R ^ 2 на графике недостаточно.
PeterR

«Так ты думаешь ...» - отличная ссылка. Пункты 1-6 (из 7) напрямую касаются поставленного здесь вопроса.
whuber

Но распределение степенного закона - это не то же самое, что подгонка отношения степенного закона между двумя отдельными переменными. Я предположил, что вопрос был о последнем, хотя я не уверен.
OneStop

χ2

2
@JM: не совсем, хи-квадрат чувствителен к биннингу, и колебания хвоста усложняют это. Я думаю, что даже с KS они перевешивают статистику для экстремальных точек, и есть некоторые обсуждения других тестов. @onestop: я предположил другой путь, и, перечитывая, вы можете быть правы. Я не совсем уверен ..
АРС

3

Если вам интересны двумерные степенные функции (в отличие от одномерных степенных распределений), то

Warton et al. « Двусторонние методы подгонки линии для аллометрии ». Biol. Ред. 81, 259-201 (2006)

отличная ссылка. В этом случае регрессия - это правильное решение, хотя могут быть некоторые исправления (OLS или RMA и т. Д.) В зависимости от того, что вы хотите, чтобы означали результаты регрессии.


Аарон - эта ссылка мертва, не могли бы вы опубликовать новую?
Кефлавич

Спасибо за это. Большая часть информации предназначена для однофакторных дистрибутивов, которые, как правило, скрывают информацию о двумерных отношениях ... Вот ссылка на список Райли onlinelibrary.wiley.com/doi/abs/10.1017/S1464793106007007
songololo
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.