Отчетность степеней свободы для t-теста Уэлча


14

T-критерий Уэлча для неравных отклонений (также известный как Уэлч-Саттерсвэйт или Уэлч-Аспин) обычно имеет нецелые степени свободы . Как следует указывать эти степени свободы при сообщении результатов теста?

«Традиционно округлять до ближайшего целого числа, прежде чем обращаться к стандартным t-таблицам» в соответствии с различными источниками * - что имеет смысл, поскольку это направление округления является консервативным. ** Некоторые старые статистические программы тоже могут это делать (например, Graphpad Prism до версии 6 ) и некоторые онлайн калькуляторы все еще делают. Если бы использовалась эта процедура, представляется целесообразным сообщить округленные степени свободы. (Хотя использование более качественного программного обеспечения может быть даже более подходящим!)

Но подавляющее большинство современных пакетов используют дробную часть, поэтому в этом случае кажется, что дробная часть должна быть заключена в кавычки. Я не думаю, что было бы уместно цитировать более двух знаков после запятой, поскольку тысячная часть степени свободы имела бы лишь незначительное влияние на р- значение.

Оглядываясь вокруг ученого Google, я вижу документы, в которых цитируется df как целое число, с одним десятичным знаком или с двумя десятичными знаками. Есть ли какие-либо рекомендации относительно того, какую точность использовать? Кроме того , если программное обеспечение используется полной дробная часть, если цитируемый ДФ округляются вниз до нужного количества цифр (например до 1 дп или как целое число) , как это было уместен с консервативный расчет, или, как мне кажется, более разумный, округленный условно ( с точностью до ближайшего ) так, чтобы до 1 dp или до ближайшего целого?7.5845...7.577.5845...7.68

Редактировать: помимо знания наиболее теоретически обоснованного способа сообщения нецелых df, было бы также полезно знать, что люди делают на практике . Предположительно, журналы и руководства по стилю имеют свои требования. Мне было бы любопытно, что требуют такие влиятельные руководства по стилю, как АПА. Из того, что я могу различить (их руководство не доступно в свободном доступе онлайн), у APA есть общее предпочтение, что почти все должно отображаться с двумя десятичными знаками, кроме p- значений (которые могут быть двумя или тремя dp) и процентов (округленных до ближайший процент) - это охватывает наклоны регрессии, t- статистику, F- статистику,χ2статистика и тд. Это довольно нелогично, учитывая, что второе десятичное место занимает совсем другую значимую цифру и предполагает совершенно иную точность в 2,47, чем в 982,47, но может объяснить число Уэлч df с двумя десятичными знаками, которые я видел в моей ненаучной выборке ,

например, Рекстон, Г.Д. T-тест с неравной дисперсией является недостаточно используемой альтернативой t-критерию Стьюдента и U-критерию Манна – Уитни , «Поведенческая экология» (июль / август 2006 г.) 17 (4): 688-690 doi: 10.1093 / beheco / ark016

Хотя само приближение Уэлча-Саттерфуэйта может быть или не быть консервативным, и в случае, когда оно не является консервативным, округление степеней свободы не является гарантией компенсации в целом.


1
Я не изучал реальную практику - вот почему это комментарий, а не ответ, - но я ожидаю, что он будет основан на суждении, связанном с сообщением значимых цифр. При относительно высоком значении df изменение первого десятичного разряда часто не приводит к изменению значения p вообще (до уровня точности, о котором сообщается), поэтому округление до целого числа вполне подходит. При очень низких значениях df и экстремальных значениях производнаяможет превышатьνt|νFν(t)|0.01, suggesting in such cases that ν should be reported to only one less significant figure than p itself.
whuber

@whuber That is indeed a useful observation, particularly when taken together with Glen_b's answer. How low is "very low" for ν? (My suspicion from the sample of papers I came across is that much "actual practice" may not be the same thing as "good practice"! I suspect robotic following of guidelines has as much effect as judgment, which is why it would be interesting to know what common reporting guidelines are.)
Silverfish

Ответы:


10

I have not studied actual practice, so this reply cannot address that aspect of the question. As a general principle I would expect the treatment of significant digits in reporting the degrees of freedom (df) to be based on judgment related to significant figures.

The principle is to be consistent: use the precision in one quantity that is appropriate for the precision used in another one that is related to it. Specifically, when reporting values x and y=f(x) when x is given to the nearest multiple of a small value h (such as h=12×106 for six places after the decimal point), the relative precision in y as mediated by the function f is

suphkh|f(x+k)f(x)|h|ddxf(x)|.

The approximation applies when f is continuously differentiable on the interval [xh,x+h].

In the present application, y is the p-value, x is the degrees of freedom ν, and

y=f(x)=f(ν)=Fν(t)

where t is the Welch-Satterthwaite statistic and Fν is the CDF of the Student t distribution with ν degrees of freedom.

For relatively high df ν, often a change in the first decimal place would not change the p-value at all (to the level of precision reported), so rounding to an integer is fine (h=1/2 but h|ddxf(x)| is very small). For very low df and extreme values of the statistic t, the magnitude of the derivative |νFν(t)| can exceed 0.01, suggesting in such cases that ν should be reported to only one less decimal place than p itself.

See for yourself with this labeled contour plot of the magnitude of the derivative for the lowest (reasonable) df and ranges of |t| that would be of interest (because they can lead to low p-values).

Figure

The labels show the base-10 logarithm of the derivative. Thus, at points between k and (k+1) on this plot, changing the reported df in the jth place after the decimal point will likely change the reported p-value only in the (j+k)th and later places. For example, suppose you are rounding the p-value to 106 (six decimal places). Consider the statistics ν=2.5 and t=8. These are located near the 3 log contour. Therefore, ν should be reported to 6+(3)=3 decimal places.

The light blue areas, for the largest k, are the ones of concern, because they show where small changes in ν have the greatest effects on the p-value.

Contrast this with the situation for higher df (from 4 to 30 shown):

Figure 2

The influence of ν on the precision of p quickly wanes as ν increases.


1
Это был очень полезный вклад в установление того, по каким принципам нужно округлять степени свободы (+50!); Я надеюсь, что более поздний ответчик сможет заполнить пробелы в реальной практике.
Серебряная рыба

7

It is conventional to round down to the nearest integer before consulting standard t tables

The reason that was a convention is because tables don't have noninteger df. There's no reason to do it otherwise.

which makes sense as this adjustment is conservative.

Well, the statistic doesn't actually have a t-distribution, because he squared denominator doesn't actually have a scaled chi-squared distribution. It's an approximation that may or may not be conservative in some particular instance -- rounding df down may not be certain to be conservative when we consider the exact distribution of the statistic in a particular instance.

(by interpolation or by actually crunching the numbers for the t-distribution with that df?)

p-values from t-distributions (applying the cdf to a t-statistic) can be computed by a variety of pretty accurate approximations, so they're effectively calculated rather than interpolated.

I can't see it being appropriate to quote to more than two decimal places

I agree.

Are there any guidelines on how much accuracy to use?

One possibility might be to investigate how accurate the Welch-Satterthwaite approximation for the p-value is in that general region of variance ratios and not quote substantially more relative accuracy than that would suggest was in the d.f. (keeping in mind that the df on the chi-squared in the square of the denominator are just giving an approximation to something that isn't chi-squared anyway).


1
I should have clarified re "rounding down is conservative". The Welch-Satterthwaite approximation itself may or may not be conservative. But the process of rounding down surely is - if the approximation was not conservative to start with, it is at least less bad after rounding down. In contrast, rounding up (e.g. "7.5845 rounds nearest to 8") is definitely not a conservative adjustment. I could do with finding a better way to phrase this, but I hope my point is clear!
Silverfish

«Одна возможность может состоять в том, чтобы исследовать, насколько точной является аппроксимация Уэлча-Саттертвэйта для p-значения в этой общей области отношений дисперсии» - это очень разумно и представляется принципиальным подходом. Это обычно делается? Несколько советов по реализации было бы неплохо. На практике я подозреваю, что руководящие принципы стиля журнала часто имеют последнее слово по этому вопросу! Но я не знаю, что они говорят - в газетах, где я проводил поиск, была определенная практика.
Серебряная рыба

To try to avoid confusion to future readers I have attempted to clarify re conservative rounding in the question body. Thanks for picking that up.
Silverfish

Я не думаю, что что-то подобное обычно делается, но я не думаю, что это означает, что этого не должно быть. То, сколько объяснений, почему один раунд / усечение попадает в определенную точку, попадает в статью, явно зависит от журнала / редактора / рецензентов.
Glen_b
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.