Итог : чем больше я узнаю о статистике, тем меньше я доверяю опубликованным работам в своей области; Я просто считаю, что исследователи недостаточно хорошо справляются со своей статистикой.
Я мирянин, так сказать. Я обучаюсь биологии, но у меня нет формального образования в области статистики или математики. Я наслаждаюсь R и часто стараюсь читать (и понимать ...) некоторые теоретические основы методов, которые я применяю при проведении исследований. Меня не удивит, если большинство людей, проводящих сегодня анализ, на самом деле не обучены формально. Я опубликовал около 20 оригинальных статей, некоторые из которых были приняты признанными журналами, и статистики часто участвовали в процессе рецензирования. Мои анализы обычно включают анализ выживаемости, линейную регрессию, логистическую регрессию, смешанные модели. Никогда еще рецензент не спрашивал о допущениях, подгонке или оценке модели.
Таким образом, я никогда особо не беспокоился о допущениях, подгонке и оценке модели. Я начинаю с гипотезы, выполняю регрессию и затем представляю результаты. В некоторых случаях я пытался оценить эти вещи, но всегда получал « хорошо, что он не соответствует всем предположениям, но я доверяю результатам (« знание предмета »), и они правдоподобны, так что все в порядке » и при консультации со статистиком они, казалось, всегда соглашались.
Теперь я разговаривал с другими статистиками и не статистиками (химиками, врачами и биологами), которые проводят анализы самостоятельно; кажется, что люди не слишком беспокоятся обо всех этих предположениях и формальных оценках. Но здесь, в резюме, есть множество людей, спрашивающих об остатках, подгонке модели, способах ее оценки, собственных значениях, векторах, и этот список можно продолжить. Позвольте мне выразиться так, когда lme4 предупреждает о больших собственных значениях, я действительно сомневаюсь, что многие из его пользователей заботятся об этом ...
Это стоит дополнительных усилий? Маловероятно ли, что большинство всех опубликованных результатов не соответствуют этим предположениям и, возможно, даже не оценивали их? Вероятно, это растущая проблема, поскольку базы данных растут с каждым днем, и существует мнение, что чем больше данные, тем менее важны предположения и оценки.
Я могу быть абсолютно неправ, но вот как я это воспринял.
Обновление: цитата позаимствована у StasK (ниже): http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509