Похоже, что в этом случае они мало обосновывают свои претензии и просто злоупотребляют статистикой, чтобы прийти к заключению, которое они уже сделали. Но бывают случаи, когда нормально не быть таким строгим с отсечками p-val. Это (как использовать статистическую значимость и предельные значения pval) - это спор, который бушует с тех пор, как Фишер, Нейман и Пирсон впервые заложили основы статистического тестирования.
Допустим, вы строите модель и решаете, какие переменные включить. Вы собираете немного данных, чтобы провести предварительное исследование потенциальных переменных. Теперь есть одна переменная, которая действительно интересует бизнес-команда, но ваше предварительное исследование показывает, что эта переменная не является статистически значимой. Однако «направление» переменной соответствует тому, что ожидала бизнес-команда, и хотя оно не соответствовало порогу значимости, оно было близко. Возможно, предполагалось, что это имеет положительную корреляцию с результатом, и вы получили бета-коэффициент, который был положительным, но значение pval было чуть выше предела 0,05.
В этом случае вы можете пойти дальше и включить его. Это своего рода неформальная байесовская статистика - ранее существовало твердое убеждение, что это полезная переменная, и первоначальное исследование показало некоторые доказательства в этом направлении (но не статистически значимые доказательства!), Поэтому вы даете ей преимущество сомнения и держать его в модели. Возможно, с большим количеством данных станет более очевидным, как они связаны с интересующим результатом.
Другим примером может быть то, где вы строите новую модель и смотрите на переменные, которые использовались в предыдущей модели - вы могли бы продолжать включать предельную переменную (которая находится на пороге значимости), чтобы сохранить некоторую преемственность от модели моделировать.
По сути, в зависимости от того, что вы делаете, есть причины быть более и менее строгими в отношении таких вещей.
С другой стороны, также важно помнить, что статистическая значимость не должна подразумевать практическую значимость! Помните, что в основе всего этого лежит размер выборки. Соберите достаточно данных, и стандартная ошибка оценки сократится до 0. Это будет иметь какое-либо значение, независимо от того, насколько оно мало, «статистически значимо», даже если в реальном мире это различие не будет иметь значения. Например, предположим, что вероятность попадания конкретной монеты на головы была .500000000000001. Это означает, что теоретически вы можете спроектировать эксперимент, который заключит, что монета нечестная, но для всех целей и целей монета может рассматриваться как честная монета.