Мне нужно некоторое руководство по соответствующему уровню объединения для использования при тестировании различий средних по данным временных рядов. Я обеспокоен временной и жертвенной псевдорепликацией, которая, кажется, находится в напряжении в этом приложении. Это относится к изучению менструального, а не к манипулятивному эксперименту.
Рассмотрим задачу мониторинга : система датчиков измеряет содержание растворенного кислорода (DO) во многих местах по всей ширине и глубине водоема. Измерения для каждого датчика записываются два раза в день, так как известно, что DO меняется в течение дня. Два значения усредняются для записи ежедневного значения. Раз в неделю ежедневные результаты агрегируются пространственно, чтобы получить единую еженедельную концентрацию DO для всего пруда.
Эти еженедельные результаты публикуются периодически, а дальнейшие агрегированные - еженедельные результаты усредняются, чтобы дать ежемесячную концентрацию DO для пруда. Ежемесячные результаты усредняются, чтобы дать годовое значение. Средние годовые значения сами усредняются, чтобы сообщать о декадных концентрациях DO для пруда.
Цель состоит в том, чтобы ответить на такие вопросы, как: концентрация DO в пруду в году X была выше, ниже или такой же, как концентрация в году Y? Отличается ли средняя концентрация DO за последние десять лет от концентрации за предыдущее десятилетие? Концентрации DO в пруду реагируют на многие входы большой величины и, таким образом, значительно варьируются. Необходим тест на значимость. Метод заключается в использовании T-критерия сравнения средств. Учитывая, что декадные значения являются средними значениями годовых значений, а годовые значения являются средними значениями месячных значений, это представляется целесообразным.
Вот вопрос - вы можете рассчитать средние декады и значения Т этих средних из месячных значений DO или из годовых значений DO. Среднее значение, конечно, не меняется, но ширина доверительного интервала и значение Т меняются. Из-за того, что при использовании месячных значений на порядок выше N, CI часто значительно ужесточается, если вы идете по этому пути. Это может дать противоположный вывод по сравнению с использованием годовых значений в отношении статистической значимости наблюдаемой разницы в средних значениях с использованием одного и того же теста на тех же данных. Как правильно интерпретировать это несоответствие?
Если вы используете ежемесячные результаты для расчета статистических данных о разнице в десятичных значениях, сталкиваетесь ли вы с временной псевдорепликацией? Если вы используете годовые результаты для расчета декадных тестов, жертвуете ли вы информацией и таким образом псевдореплицируете?