Вот некоторый контекст. Я заинтересован в определении того, как две переменные среды (температура, уровни питательных веществ) влияют на среднее значение переменной отклика за 11-летний период. В течение каждого года есть данные из более чем 100 тысяч мест.
Цель состоит в том, чтобы определить, отразилось ли в течение 11-летнего периода среднее значение переменных отклика на изменениях переменных среды (например, более высокая температура + больше питательных веществ = больший отклик).
К сожалению, поскольку ответом является среднее значение (без учета среднего значения, только регулярные межгодовые колебания затопят сигнал), регрессия составит 11 точек данных (1 среднее значение в год) с 2 пояснительными переменными. Для меня даже линейную положительную регрессию будет трудно считать значимой, учитывая, что набор данных настолько мал (даже не соответствует номинальным 40 точкам / переменной, если только отношение не является сверхсильным).
Правильно ли я сделать это предположение? Может ли кто-нибудь предложить какие-либо другие мысли / перспективы, которые я могу упустить?
PS: некоторые предостережения: невозможно получить больше данных, не дожидаясь дополнительных лет. Таким образом, доступные данные - это то, с чем нам действительно нужно работать.