Число 20 волшебство?


12

У меня есть ссылки, в которых рекомендуется учитывать размер выборки не менее 20 для распределения данных.

Есть ли в этом смысл?

Благодарность


3
В общем нет, в определенных ситуациях может быть. У вас есть рекомендации и каковы ваши цели?
image_doctor

1
Я бы согласился с @image_doctor - нет общей причины, почему 20 наблюдений следует рассматривать как минимум; это может иметь место в очень конкретных обстоятельствах.
Glen_b

3
Одна величины будет работать в некоторых практических случаях, например, когда распределение известно (с уверенностью) , чтобы быть Пуассон и наблюдение является большим графом. Это не только позволяет распределению соответствовать, но и позволяет оценить вероятную ошибку в оценке его параметра.
whuber

1
Я считаю, что я также читал, что для нормальных дистрибутивов 30 - это практическое правило. Мне кажется, это было связано с тем, насколько близок уровень студента с 30 степенями свободы к норме. Но это просто правило. Это не магия в том же смысле , что значение есть. e
Уэйн

1
Да, 20 магическое число: en.wikipedia.org/wiki/Magic_number_%28physics%29
Побитовое

Ответы:


13

Многое из этого зависит от ожидаемого распределения и от того, каков ваш вопрос исследования. Как правило, вы должны быть осторожны с правилами. Если вы знаете ожидаемое распределение, запустите некоторые моделирования разных размеров и определите, как часто выборочные моделирования отражают фактическое распределение. Это должно дать вам некоторые рекомендации в качестве окончательного требуемого размера выборки.


+1 за избавление от экстремальных и догматических высказываний.
whuber

1
+1 частично из-за «Как правило, вы должны быть осторожны с правилами».
Вольфганг

7

Я думал, что магический номер выборки равен 1000. Это то, что есть в большинстве национальных опросов США, чтобы получить погрешность около 3%: В действительности эффективные размеры выборки ниже более 1000, более примерно 700 или около того, из-за неравной вероятности выбора и корректировки без ответа, что приводит к погрешности 3,7%.

z0.9750.50.5/1000=1.960.158=0.031

Всего лишь с 20 наблюдениями вы технически не можете получить очень высокие значения асимметрии и эксцесса (конечно, нормализованные по стандартным отклонениям выборки):

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.
Если вы подбираете распределение по методу моментов, вы, очевидно, не можете подобрать логнормальное распределение с достаточно типичной дисперсией бревен, равной 1 (распределение доходов в странах с неравным доходом от среднего до высокого уровня; США, Бразилия, Южная Африка, В России все имеют более высокую дисперсию лог-доходов), так как она имеет удивительно большой эксцесс 111. Конечно, было бы глупо подбирать логнормальное распределение методом моментов, но я просто хотел показать, что некоторые распределения реального мира будут скорее всего будет сложнее, чем то, что можно описать 20 наблюдениями.

Другой взгляд на распределение фитинга может быть принято путем оценки плотности ядра: для выборки размера , то наиболее популярным правилом дает полосу пропускания которая эффективно охватывает весь дистрибутив, используя ядро ​​Гаусса. Другими словами, большинство образцов размера 20 будут выглядеть нормально, если вы проведете оценку плотности ядра через них, если только у них явно не будет заметного эксцесса (что тогда будет означать, что есть некоторые отдаленные наблюдения, которые проявятся как отдельные удары по плотности ядра). участок).ч = 1,06 σ п - 1 / 5 = 0,58 σn=20

h=1.06σ^n1/5=0.58σ^

Я не слежу за актуальностью ограничений на моменты сэмплов. Конечно, вы можете получить чрезвычайно высокие оценки асимметрии и эксцесса в выборке. Попробуйте это: когда - среднее значение выборки, а - SD выборки, тогда оценочная асимметрия при совпадении моментов в логнормальном распределении равна . Сгенерируйте выборку из из дистрибутива с большим геометрическим SD ( будет работать), и вы получите огромные оценки асимметрии. Так что, если асимметрия необработанного образца мала? с ( с / м ) ( 3 + ( с / м ) 2 ) 20 2ms(s/m)(3+(s/m)2)202
whuber

1
Обязательная ссылка на «Синдром власти десяти» в контексте использования 1000 в качестве размера выборки (в контексте статистики, связанной с программированием, но она применяется в других местах): zedshaw.com/essays/programmer_stats.html
Гэри С. Уивер

1
@ whuber, ты слишком умный, без обид. Большинство людей вычисляют асимметрию как момент данных, а не через параметрическое предположение, как вы только что сделали. Теперь, если я скажу: «Предположим, вы подбираете распределение Пирсона методом моментов» - будет ли этот аргумент уместным, тогда?
StasK

Да, это будет актуально во многих случаях. Я последовал вашему предложению подгонять логнормальное распределение, используя метод моментов, и получил большую асимметрию - ничего удивительного. Это потому, что я сопоставил только первые два момента, позволив третьему быть тем, чем оно может быть. Если бы я следовал той же процедуре с любым семейством распределения, состоящим из двух или меньшего числа параметров, которое допускает произвольно большие третьи моменты, я думаю, я бы увидел то же самое явление. С семейством Пирсонов, имеющим более двух параметров, мы, вероятно, попытаемся сопоставить эмпирическую асимметрию, тем самым ограничив ее значение.
whuber

2

Нет. Не удаленно.

Подумайте об этом так: если у вас было миллиардное пространство (человечество), и вы взяли 20 образцов, используя любой метод (20 человек), могли бы вы использовать полученную информацию, чтобы понять достаточно хорошо каждого человека на планете? Не удаленно. В галактике Млечный Путь 100 миллиардов звезд. Выбрав (случайно) 20 из них, вы сможете понять всю галактическую астрономию? Ни за что.

В одномерном пространстве есть некоторые эвристические, в основном действующие практические правила, которые могут помочь, которые описывают, сколько измерений вы хотите выполнить. Они включают в себя различные степени полезности и обоснованности, но в некотором смысле более надежно защищены, чем «20». Они включают «5 измерений на переменную в вашем уравнении подгонки», «не менее 35 выборок гауссовой функции плотности» и «не менее 300 выборок биномиальной функции». Реальные статистики, а не ботаник-бомбардировщик, как я, смогут связать определенные доверительные интервалы и неопределенности из первых принципов и без калькулятора.

Если вы используете правило «5 измерений на параметр в уравнении подгонки» и хотите подогнать кумулятивную плотность двумерной криволинейной бикубической поверхности с точки зрения распределения высот, у вас будет базовая система, которая , отношение многочлена 5-го порядка к кубике. Он будет иметь 6 + 4 = 10 коэффициентов. Если вы пытаетесь подогнать свои 10 значений параметров, используя 2 измерения на параметр или 20 измерений, то вы нарушите эту эвристику. Эта эвристика рекомендует минимум 10 * 5 = 50 измерений.a3r3+a2r2+a1r+a0a1r+a0dr

Пожалуйста, помните, что «лучшее» - это бессмысленная идея без «меры благости». Какой путь лучше? Если вы собираетесь на гибель, может быть, очень долго и приятно. Если вы собираетесь на собственную коронацию, возможно, короткую и великолепную. Если вы идете по пустыне, крутой тенистый. Какое «лучшее» количество образцов? Это так потрясающе зависит от вашей проблемы, что на него нельзя начать отвечать авторитетно до этого. Все они? Столько, сколько вы можете? Это только немного смысла. Да, это как будто частично умерла или забеременела. Быть частично бессмысленным является следствием очень недостаточно определенной проблемы.

Если вы пытаетесь точно прогнозировать воздушный поток над самолетом? Вам может понадобиться несколько миллионов измерений, чтобы попасть в парк. Если вы хотите знать, какой у вас рост, один или два могут выполнить эту работу.

Это не затрагивает важных моментов «охвата пространства» и «выборки в местах, которые сводят к минимуму расхождения в оценках параметров», но вопрос предполагал, что более уместным будет ответ на уровне первокурсника. Эти вещи требуют знаний о природе проблемы, прежде чем они могут быть реализованы.

Примечание: отредактировано для улучшения согласно предложениям.


1
Вы, кажется, прочитали «минимум» в вопросе как «максимум» или «достаточно». Ничто из того, что вы написали, не противоречит эмпирическому правилу минимума 20.
whuber

2
@whuber, я работаю среди людей, которые считают дополнительные измерения дорогими, и если я предоставлю им «минимальное количество выборок», они не воспримут это как неравенство, где потенциальное количество выборок больше, чем это. Они думают об этом как о границе для задачи оптимизации минимизации затрат, и пытаются работать только с этим значением. Это продукт моей среды.
EngrStudent

1

Возможно, для контекста, в котором вы проводите t-тесты или ANOVAR - довольно распространенный контекст в базовых статистических приложениях - он касается размера выборки, необходимого для каждой группы, чтобы иметь возможность быть уверенным в среднем значении каждой группы приблизительно нормально распределенный (в соответствии с центральной предельной теоремой), когда можно предположить, что распределение более или менее унимодально и не очень пиково. Двадцать, а не девятнадцать или двадцать один, потому что это круглое число.


0

Посетите страницу Расса Лента и информацию о размере выборки, чтобы найти статьи на эту тему (в разделе «Советы» в середине страницы).

Минимальное количество лиц в вашей выборке сильно варьируется в зависимости от размера популяции, количества измерений (если вы делите данные по категориям) и мер (если вы принимаете непрерывные меры в отношении выборочных лиц), которые вы принимаете, размера ваша вселенная, метод анализа, который вы намереваетесь использовать (это очень важный момент - метод определяется во время планирования исследования или во время эксперимента , а не после), и сложность, показанная в предыдущих исследованиях.

И 20 недостаточно для каких-либо серьезных исследований за пределами предметов «редких болезней» и «экспериментальной психологии» (псих, как определил Поппер в своей работе).

Уточнение ответа на основе комментариев ниже:

И 20 недостаточно для какого-либо серьезного исследования вне предмета «редких болезней» и «экспериментальной психологии» (псих, как определил Поппер в своей работе), которое включает в себя подбор распределения вероятностей .

И нет, вы не должны отравлять людей, чтобы получить большую выборку. Здравый смысл и последовательные тесты приказывают вам остановиться.


3
Я думаю, что слишком экстремально утверждать, что выборка из 20 «недостаточна для любого серьезного исследования». Это противоречит вашим предыдущим утверждениям о том, что соответствующий размер выборки зависит от цели, группы населения и т. Д. В некоторых случаях одного фальсифицирующего результата достаточно, чтобы убить всю теорию.
whuber

1
Тематические исследования и качественные исследования могут хорошо работать с 1-5 участниками.
Behacad

Хорошо, добавьте «тематические исследования» и «фокус-группы» в список :) Они включены в то, что я сказал, что Поппер назвал «экспериментальной психологией».
Лукас Галлиндо

4
Тогда вам лучше добавить астрономию, медицину, биологию, химию, ... Другими словами, утверждать, что 20 «недостаточно», так же плохо, как утверждать, что он достаточно хорош. На самом деле, это, наверное, хуже. Представьте себе испытание безопасности пищевых продуктов, в котором первые восемь субъектов, которым вводили пищевую добавку, умерли от непредвиденных побочных эффектов. Будете ли вы выступать за продолжение тестирования на основе вашего заявления «20 недостаточно»?
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.