Я бы сказал, что первое, что вы перечислите, является, вероятно, наиболее распространенным - и, возможно, наиболее широко изучаемым способом - из вещей, которые явно видятся неправильными, но вот некоторые другие, которые менее ясны в некоторых ситуациях ( действительно ли они применимы), но могут повлиять на еще больше анализов, и, возможно, более серьезно. Они часто просто никогда не упоминаются, когда вводится предмет регрессии.
Рассматривать как случайные выборки из совокупности наблюдений, представляющих интерес, которые не могут быть близки к репрезентативным (не говоря уже о случайной выборке). [Вместо этого некоторые исследования можно рассматривать как нечто ближе к удобным образцам]
С данными наблюдений, просто игнорируя последствия пропуска важных движущих сил процесса, которые, безусловно, смещают оценки коэффициентов включенных переменных (во многих случаях, даже к вероятному изменению их знака), без попытки рассмотреть способы решения с ними (будь то по незнанию проблемы или просто не подозревая, что что-либо можно сделать). [В некоторых областях исследований эта проблема стоит больше, чем в других, будь то из-за видов собираемых данных или из-за того, что люди в некоторых областях применения с большей вероятностью обучались этой проблеме.]
Ложная регрессия (в основном с данными, собранными с течением времени). [Даже когда люди знают, что это происходит, есть еще одно распространенное заблуждение, что достаточно просто отличить от предполагаемого стационарного, чтобы полностью избежать проблемы.]
Конечно, можно упомянуть много других (например, обращение с независимыми данными, которые почти наверняка будут последовательно коррелированными или даже интегрированными, может быть примерно таким же распространенным).
Вы можете заметить, что обсервационные исследования данных, собранных с течением времени, могут быть затронуты всеми этими моментами одновременно ... но этот вид исследований очень распространен во многих областях исследований, где регрессия является стандартным инструментом. То, как они могут добраться до публикации без единого рецензента или редактора, знающего хотя бы об одном из них и по крайней мере требующего некоторого уровня отказа от ответственности в выводах, продолжает меня беспокоить.
Статистика таит в себе проблемы с невоспроизводимыми результатами, когда речь идет о достаточно тщательно контролируемых экспериментах (в сочетании с, возможно, не столь тщательно контролируемыми анализами), поэтому, насколько хуже должна быть ситуация воспроизводимости?