Понимание вывода начальной загрузки, выполненной в R (tsboot, MannKendall)


11

У меня есть вопрос, касающийся интерпретации вызова tsboot в R. Я проверил документацию как Kendall, так и загрузочного пакета, но я не умнее, чем раньше.

Когда я запускаю бутстрап, используя, например, пример из пакета Kendall, где статистикой теста является тау Кендалла:

library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)

что подтверждает тенденцию к росту:

tau = 0.265, 2-sided pvalue =0.00029206

Затем в примере продолжает использоваться блок начальной загрузки:

#
#Use block bootstrap 
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")

Я получаю следующий результат:

BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5 
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5, 
sim = "fixed")


Bootstrap Statistics :
 original     bias    std. error
t1* 0.2645801 -0.2670514  0.09270585

Если я правильно понимаю, «t1 * original» - это исходный MKtau, «bias» - это среднее значение MKtau из загруженного временного ряда R = 500, а «std. Error» - стандартное отклонение MKtaus от 500 образцов.

Мне трудно понять, что это значит - это в основном говорит мне, что все 500 MKTaus ниже, чем оригинал, и что исходный t1 * находится в диапазоне 3 sd загрузочного MKtaus. Эрго это существенно отличается?

Или я бы сказал, что MKtau для набора данных составляет 0,26 плюс / минус стандартная ошибка?

Я прошу прощения за длинный вопрос, но я новичок в статистике и учусь через самообучение, и мне не хватает кого-то, с кем можно было бы справиться с этой, вероятно, очень простой проблемой.


6
На выходе biasпросто разница между средним значением 500 сохраненных образцов начальной загрузки и исходной оценкой. Это std. errorстандартное отклонение 500 выборок начальной загрузки и оценка стандартной ошибки. Выходные данные говорят вам, что ваша первоначальная оценка выше, чем среднее значение из 500 загрузочных оценок (поэтому не все загрузочные MKtaus ниже). Бутстрап часто используется для расчета стандартных ошибок / доверительных интервалов, не делая предположений о распределении. Используйте boot.ciфункцию для расчета доверительных интервалов.
COOLSerdash

@COOLSerdash, спасибо за это! Так что, если моя исходная статистика на 3 sd выше среднего значения начальной статистики, могу ли я тогда что-то сделать напрямую (скажем: статистика значима при 0,99)? Я также использовал boot.ciдля вычисления доверительных интервалов, и снова, первоначально вычисленная статистика лежит вне этих интервалов.
Мария

Нет, вы не сравниваете загруженную статистику с исходной статистикой с проверкой гипотезы. Я бы просто использовал / сообщил о загрузке стандартных ошибок и доверительных интервалов в вашем случае.
COOLSerdash

Ответы:


3

Столкнувшись с тем же вопросом и изучив его с помощью управляемого набора данных - модель y = ax + b с ошибками N (0, sig), я обнаружил, что пакет Kendall может работать не так, как объявлено. Х в моем случае было 1:100, а у = х , с сиг = 100 (дисперсия ошибки термина).

Регрессия выглядит хорошо, как и та Кендалла. Здесь нет автокорреляции, кроме индуцированной линейной моделью. Выполнение теста Кендалла, объявленного с длинами блоков 1, 3, 5 и 10, приводит к очень большим значениям смещения и не boot.ciсообщает о тенденции.

Впоследствии я вручную запрограммировал загрузчик данных с этими длинами блоков, и с моими контрольными рядами я получил разумные результаты относительно среднего значения выборок загрузчика и их разброса. Следовательно, возможно, что с пакетом Kendall что-то пошло не так в отношении начальной загрузки блока.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.