SD больше среднего, неотрицательная шкала


9

Мне дали статью, в которой сообщалось об исследовании, очень похожем на исследование, которое хочет провести моя лаборатория. Но я заметил, что для интересующей переменной, Duration, SD больше среднего ... так как эта длительность измеряется в минутах, она никогда не может быть отрицательной, и это кажется мне очень странным. Это произошло в двух исследованиях, о которых сообщается ниже.

Кроме того, это смешанный дизайн. Контроль v Обработка (между группами) и Время1, Время2, Время3 (повторные измерения). Вот средства (SD), N> 200

                       Time1                Time2                  Time3 
Control               15.1 (14.6)          14.4 (14.8)            13.3 (15.7)
Treatment             14.8 (13.2)          10.0 (12.2)            8.2 (9.9)

... они запустили ANOVA и сообщили о р <0,001.

Меня попросили использовать это в качестве основы для анализа мощности, чтобы определить размер выборки для нашего исследования. Я почти уверен, что это указывает на то, что данные не являются нормальными или имеют выбросы, и мне не удобно определять размер выборки на основе этого. Я просто далеко от базы?


Вы уверены, что это SD, а не 95% доверительные интервалы, которые могут быть больше похожи на 3 * SD. Похоже, эти SD примерно того же размера, что и средства. Трудно сказать, каков размер выборки, поскольку мы не знаем, какие эффекты были включены в эти ошибки или даже какова статистика. Если бы это был просто подсчет статистики, то есть распределения Пуассона, то среднее значение по SD должно быть как 1 / Sqrt (N). Однако это подразумевает N = 1 (или несколько не более). Можете ли вы дать нам больше информации о статистике?
Dave31415

Кроме того, нормальное распределение имеет среднее значение и SD, которые полностью независимы друг от друга. Я думаю, возможно, вы имели в виду распределение Пуассона.
Dave31415

2
С длительностями, которые неотрицательны, я обычно ожидал бы искаженное распределение. Сопоставимые со средним SD вполне возможны и ни в коем случае не удивительны. Какое распределение лучше всего использовать для других вычислений, нельзя посоветовать без дополнительной информации, но я бы не выбрал Пуассона в качестве первого предположения, а скорее гамма или логнормальный.
Ник Кокс

Как отмечает @NickCox, с продолжительностью я был бы удивлен, если бы SD не был больше среднего (если бы не было цензуры). Вы также можете рассмотреть распределение Вейбулла. Анализ мощности, вероятно, должен быть основан на моделировании. С другой стороны, я бы предположил, что ANOVA была недействительной с такими данными.
gung - Восстановить Монику

1
NО(N)0

Ответы:


5

Стандартное отклонение может легко превысить среднее значение с неотрицательными или строго положительными данными.

Я бы описал случай для ваших данных как стандартное отклонение, близкое к среднему (не каждое значение больше, а те, которые больше, обычно близки). Для неотрицательных данных это довольно четко указывает на то, что данные искажены (например, гамма-распределение с коэффициентом вариации = 1 было бы экспоненциальным распределением, поэтому, если бы данные были гамма, они выглядели бы где-то рядом с экспоненциальным)

Тем не менее, при таком размере выборки ANOVA может не особенно пострадать от этого; неопределенность в оценке объединенной дисперсии будет довольно мала, поэтому мы могли бы рассмотреть, что между CLT (для средних) и теоремой Слуцкого (для оценки дисперсии по знаменателю) ANOVA, вероятно, будет работать достаточно хорошо, так как вы ' будет иметь асимптотический хи-квадрат, для которого ANOVA-F с его большим знаменателем степеней свободы будет хорошим приближением. (то есть он должен иметь разумную устойчивость уровня, и поскольку средства не так уж далеки от постоянных, гетероскедастичность не должна слишком сильно влиять на силу)

Тем не менее, если ваше исследование будет иметь меньший размер выборки, вам, возможно, будет лучше взглянуть на другой тест (возможно, тест на перестановку или еще один, пригодный для искаженных данных, возможно, на основе GLM). Для изменения теста может потребоваться несколько больший размер выборки, чем для обычного ANOVA.

С исходными данными вы можете провести анализ мощности по подходящей модели / анализу. Даже в отсутствие исходных данных можно было бы сделать более правдоподобные предположения о распределении (возможно, разнообразные из них) и исследовать всю кривую мощности (или, проще говоря, только частоту ошибок типа I и мощность при любом значении эффекта). представляет интерес). Можно использовать различные разумные допущения, которые дают некоторое представление о том, какую мощность можно достичь при вероятных обстоятельствах и насколько большим может быть размер выборки.


4

Вы правильно сделали вывод, что данные ненормальные. Если бы данные были нормальными, то мы ожидали бы, что около 16% наблюдений будут меньше среднего значения минус стандартное отклонение. Если SD больше среднего, это число является отрицательным, и вы заявляете, что не может быть отрицательных чисел, поэтому то, что вы видите, не согласуется с нормально распределенными данными. Значения SD возможны, но только если распределение очень искажено (что характерно для длительностей).

Я согласен, что выбор размера выборки, основанный на допущении, что данные будут нормальными, не очень хорошая идея, но если вы можете узнать больше о процессе и найти правильное искаженное распределение (гамма-распределение как одна из возможностей), которое является разумным предположением, тогда вы можете использовать это, чтобы помочь определить размер выборки.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.