ANOVA с фиксированными эффектами (или его эквивалент линейной регрессии) предоставляет мощное семейство методов для анализа этих данных. Чтобы проиллюстрировать это, вот набор данных, согласующийся с графиками среднего HC за вечер (один график на цвет):
| Color
Day | B G R | Total
-------+---------------------------------+----------
1 | 117 176 91 | 384
2 | 208 193 156 | 557
3 | 287 218 257 | 762
4 | 256 267 271 | 794
5 | 169 143 163 | 475
6 | 166 163 163 | 492
7 | 237 214 279 | 730
8 | 588 455 457 | 1,500
9 | 443 428 397 | 1,268
10 | 464 408 441 | 1,313
11 | 470 473 464 | 1,407
12 | 171 185 196 | 552
-------+---------------------------------+----------
Total | 3,576 3,323 3,335 | 10,234
ANOVA count
против day
и color
производит эту таблицу:
Number of obs = 36 R-squared = 0.9656
Root MSE = 31.301 Adj R-squared = 0.9454
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 605936.611 13 46610.5085 47.57 0.0000
|
day | 602541.222 11 54776.4747 55.91 0.0000
colorcode | 3395.38889 2 1697.69444 1.73 0.2001
|
Residual | 21554.6111 22 979.755051
-----------+----------------------------------------------------
Total | 627491.222 35 17928.3206
Значение model
р, равное 0,0000, показывает, что подгонка очень значительна. Значение day
р 0,0000 также очень важно: вы можете обнаруживать ежедневные изменения. Тем не менее, значение color
(семестр) p, равное 0.2001, не следует считать значимым: вы не можете обнаружить систематическое различие между тремя семестрами, даже после учета ежедневных изменений.
HSD- тест Тьюки («достоверная значимая разница») выявляет следующие значимые изменения (среди прочих) в ежедневных средних значениях (независимо от семестра) на уровне 0,05:
1 increases to 2, 3
3 and 4 decrease to 5
5, 6, and 7 increase to 8,9,10,11
8, 9, 10, and 11 decrease to 12.
Это подтверждает то, что глаз видит на графиках.
Поскольку графики прыгают совсем немного, нет способа обнаружить повседневные корреляции (последовательные корреляции), что является целым моментом анализа временных рядов. Другими словами, не беспокойтесь о методах временных рядов: здесь недостаточно данных, чтобы обеспечить более глубокое понимание.
Нужно всегда удивляться, насколько можно верить результатам любого статистического анализа. Различные методы диагностики гетероскедастичности (такие как тест Бреуша-Пагана ) не показывают ничего плохого. Остатки выглядят не совсем нормально - они сгруппированы в некоторые группы - поэтому все значения p должны быть взяты с крошкой соли. Тем не менее они, по-видимому, обеспечивают разумное руководство и помогают количественно оценить смысл данных, которые мы можем получить, глядя на графики.
Вы можете провести параллельный анализ дневных минимумов или дневных максимумов. Обязательно начните с аналогичного графика в качестве руководства и проверьте статистический вывод.