В конце концов, если для написания статьи потребовались годы, и она прошла тщательный рецензирование, то, несомненно, статистика будет надежной?
Мой опыт чтения статей, которые пытаются применять статистику в самых разных областях (политология, экономика, психология, медицина, биология, финансы, актуарная наука, бухгалтерский учет, оптика, астрономия и многие, многие другие), заключается в том, что качество статистический анализ может быть где угодно в спектре от превосходного и хорошо сделанного до вопиющей бессмыслицы. Я видел хороший анализ в каждой из областей, которые я упомянул, и довольно плохо проведенный анализ почти во всех из них.
Некоторые журналы, как правило, довольно хороши, а некоторые могут больше походить на игру в дартс с завязанными глазами - большинство из них вы можете получить не слишком ужасно далеко от цели, но некоторые будут в стене, на полу и потолке. И, возможно, кот.
Я не планирую называть виновных, но скажу, что я видел академическую карьеру, основанную на неправильном использовании статистики (то есть, когда одни и те же ошибки и недоразумения повторялись на бумаге за бумагой в течение более десяти лет).
Поэтому мой совет: пусть читатель остерегается ; не верьте, что редакторы и рецензенты знают, что они делают. Со временем вы можете понять, на каких авторов обычно можно положиться, чтобы они не делали ничего слишком шокирующего, а на каких следует относиться особенно осторожно. Вы можете почувствовать, что некоторые журналы обычно имеют очень высокий стандарт для своей статистики.
Но даже обычно хороший автор может ошибиться, или рецензенты и редакторы могут не заметить ошибок, которые они обычно могут найти; Как правило, хороший журнал может публиковать ревун.
[Иногда вы даже увидите, что действительно плохие газеты получают призы или награды ... что тоже мало говорит о качестве людей, оценивающих приз.]
Я не хотел бы догадываться, какую долю «плохой» статистики я мог видеть (в разных ипостасях и на каждом этапе от определения вопроса, дизайна исследования, сбора данных, управления данными, ... вплоть до анализ и выводы), но он не настолько мал, чтобы чувствовать себя комфортно.
Я мог бы привести примеры, но я не думаю, что это правильный форум для этого. (Было бы неплохо, если бы для этого был хороший форум, но, с другой стороны, он, скорее всего, довольно быстро «политизировался бы» и вскоре не смог бы выполнить свою задачу.)
Я потратил некоторое время на просмотр PLOS ONE ... и снова, не собираясь указывать на конкретные документы. Некоторые вещи, которые я заметил: похоже, что большая часть статей содержит статистику, вероятно, более половины имеют тесты на гипотезы. Основными опасностями, по-видимому, являются многочисленные тесты, либо с высоким например 0,05 на каждый (что не является автоматически проблемой, если мы понимаем, что довольно много действительно крошечных эффектов могут оказаться значительными по случайности), или невероятно низкий уровень индивидуальной значимости, который будет иметь тенденцию давать низкую мощность. Я также видел ряд случаев, когда около полудюжины различных тестовαбыли, по-видимому, применены для решения точно такого же вопроса. Это кажется мне вообще плохой идеей. В целом стандарт был довольно хорошим для нескольких десятков газет, но в прошлом я видел там совершенно ужасную газету.
[Возможно, я мог бы потворствовать только одному примеру, косвенно. Этот вопрос задает вопрос о том, кто делает что-то весьма сомнительное. Это далеко не самое худшее, что я видел.]
С другой стороны, я также вижу (еще чаще) случаи, когда люди вынуждены перепрыгивать через все виды ненужных обручей, чтобы их анализ был принят; совершенно разумные вещи не принимаются, потому что есть «правильный» способ сделать что-то по мнению рецензента, редактора или руководителя, или просто в негласной культуре конкретной области.