Мне нравится книга Дж. Ван Белля о статистических правилах большого пальца и, в меньшей степени, распространенные ошибки в статистике (и как их избежать) от Филиппа Гуда и Джеймса У. Хардина. Они учитывают распространенные ошибки при интерпретации результатов экспериментальных и наблюдательных исследований и предоставляют практические рекомендации для статистического вывода или анализа поисковых данных. Но я чувствую, что «современных» руководств в некоторой степени не хватает, особенно в связи с постоянно растущим использованием вычислительной и надежной статистики в различных областях или внедрением методов сообщества машинного обучения, например, в клиническую биостатистику или генетическую эпидемиологию.
Помимо вычислительных уловок или распространенных ошибок в визуализации данных, о которых можно было бы поговорить в другом месте, я хотел бы спросить: какие практические рекомендации вы бы порекомендовали для эффективного анализа данных? ( одно правило на ответ, пожалуйста ).
Я думаю о руководящих принципах, которые вы могли бы предоставить коллеге, исследователю, не обладающему достаточным опытом в области статистического моделирования, или студенту, проходящему курс среднего и продвинутого уровня. Это может относиться к различным этапам анализа данных, например стратегиям выборки, выбору признаков или построению модели, сравнению модели, последующей оценке и т. Д.