Какое временное разрешение для теста значимости временных рядов?

Мне нужно некоторое руководство по соответствующему уровню объединения для использования при тестировании различий средних по данным временных рядов. Я обеспокоен временной и жертвенной псевдорепликацией, которая, кажется, находится в напряжении в этом приложении. Это относится к изучению менструального, а не к манипулятивному эксперименту.

Рассмотрим задачу мониторинга : система датчиков измеряет содержание растворенного кислорода (DO) во многих местах по всей ширине и глубине водоема. Измерения для каждого датчика записываются два раза в день, так как известно, что DO меняется в течение дня. Два значения усредняются для записи ежедневного значения. Раз в неделю ежедневные результаты агрегируются пространственно, чтобы получить единую еженедельную концентрацию DO для всего пруда.

Эти еженедельные результаты публикуются периодически, а дальнейшие агрегированные - еженедельные результаты усредняются, чтобы дать ежемесячную концентрацию DO для пруда. Ежемесячные результаты усредняются, чтобы дать годовое значение. Средние годовые значения сами усредняются, чтобы сообщать о декадных концентрациях DO для пруда.

Цель состоит в том, чтобы ответить на такие вопросы, как: концентрация DO в пруду в году X была выше, ниже или такой же, как концентрация в году Y? Отличается ли средняя концентрация DO за последние десять лет от концентрации за предыдущее десятилетие? Концентрации DO в пруду реагируют на многие входы большой величины и, таким образом, значительно варьируются. Необходим тест на значимость. Метод заключается в использовании T-критерия сравнения средств. Учитывая, что декадные значения являются средними значениями годовых значений, а годовые значения являются средними значениями месячных значений, это представляется целесообразным.

Вот вопрос - вы можете рассчитать средние декады и значения Т этих средних из месячных значений DO или из годовых значений DO. Среднее значение, конечно, не меняется, но ширина доверительного интервала и значение Т меняются. Из-за того, что при использовании месячных значений на порядок выше N, CI часто значительно ужесточается, если вы идете по этому пути. Это может дать противоположный вывод по сравнению с использованием годовых значений в отношении статистической значимости наблюдаемой разницы в средних значениях с использованием одного и того же теста на тех же данных. Как правильно интерпретировать это несоответствие?

Если вы используете ежемесячные результаты для расчета статистических данных о разнице в десятичных значениях, сталкиваетесь ли вы с временной псевдорепликацией? Если вы используете годовые результаты для расчета декадных тестов, жертвуете ли вы информацией и таким образом псевдореплицируете?

time-series

Ваш вопрос довольно сложный ... Я думаю об этом.

— deps_stats

Я считаю, что вы пытаетесь использовать статистические методы, которые подходят для независимых наблюдений, в то время как вы коррелировали данные, как временно, так и пространственно. Если у вас есть наблюдения, скажем, в течение 5 часов, и вы решили переформулировать это как 241 наблюдение, сделанное каждую минуту, у вас действительно нет 240 степеней свободы относительно среднего из этих 241 значений. Автокорреляция потенциально приводит к завышению размера «N» и, таким образом, создает ложные утверждения о неопределенности. Что вам нужно сделать, так это найти кого-нибудь / какой-нибудь учебник / какой-нибудь веб-сайт / ...., который научит вас данным временных рядов и их анализу. Один из способов начать - это «помочь мне понять временной ряд» и начать читать / учиться. В Интернете доступно много материалов.http://www.autobox.com/AFSUniversity/afsuFrameset.htm . Я упоминаю об этом, так как я все еще связан с этой фирмой и ее продуктами, поэтому мои комментарии «предвзяты и самоуверенны», но не исключительно корыстны.

— IrishStat
источник