Является ли результат экзамена биномиальным?


31

Вот простой статистический вопрос, который мне дали. Я не совсем уверен, что понимаю это.

X = количество набранных баллов на экзамене (множественный выбор и правильный ответ - одно очко). Распространен ли бином X?

Ответ профессора был:

Да, потому что есть только правильные или неправильные ответы.

Мой ответ:

Нет, потому что каждый вопрос имеет свою «вероятность успеха» с. Как я понял, биномиальное распределение - это просто серия экспериментов Бернулли, каждый из которых имеет простой результат (успех или неудача) с заданной вероятностью успеха p (и все они «идентичны» в отношении p). Например, подбрасывая (справедливую) монету 100 раз, это 100 экспериментов Бернулли, и все они имеют p = 0,5. Но здесь вопросы имеют разные виды, верно?


14
+1 Еще более к сути: если это действительно не странный экзамен, ответы на вопросы будут сильно коррелированы. Если - это общий балл для человека, это исключит биномиальное распределение. Возможно ли, что вопрос работает в предположении «нулевой гипотезы», в котором все испытуемые независимо и случайным образом угадывают все ответы? X
whuber

2
Как это ни парадоксально, я бы хотя бы лоббировал это за частичное признание, но «ответ», кажется, отражает нежелание присудить его :) (я думаю, что вы здесь).
AdamO

1
Да, спасибо: D, я думаю, что это больше биномиальное распределение Пуассона (если что-нибудь)
Пол


2
Я согласен со всеми, что вопрос был плохим, но здесь есть проблема создания. Если это элементарный курс и формат коротких ответов (чтобы у вас была возможность объяснить свои аргументы), я бы сказал, что лучший ответ, вероятно, «да (при условии независимости и равной сложности для каждого вопроса)»; это будет сигнализировать профессору, что (1) вы понимаете ограничения вопроса и (2) вы не пытаетесь быть умником.
Бен Болкер,

Ответы:


25

Я бы согласился с вашим ответом. Обычно такие данные в настоящее время моделируются с помощью некоторой модели теории ответа на предмет . Например, если вы использовали модель Раша , то бинарный ответ будет смоделирован какXni

Pr{Xni=1}=eβnδi1+eβnδi

где можно рассматривать как способность человека, а как вопроса. Таким образом, модель позволяет уловить тот факт, что разные люди различаются по способностям, а вопросы различаются по сложности, и это самая простая из моделей IRT. n δ i iβnnδii

Ваш профессора ответ предполагает , что все вопросы имеют одинаковую вероятность «успеха» и являются независимыми, так как бином представляет собой распределение суммы IID Бернулли. Он игнорирует два вида зависимостей, описанных выше.n

Как отмечалось в комментариях, если вы посмотрели на распределение ответов конкретного человека (так что вам не нужно беспокоиться об изменчивости между людьми) или ответов разных людей на один и тот же элемент (так что между изменчивости), то распределение будет пуассоново-биномиальным, т. е. распределение суммы неидеальных испытаний Бернулли. Распределение может быть аппроксимировано биномиальным или пуассоновским, но это все. В противном случае вы делаете предположение iid.n

Даже при «нулевом» допущении об угадывании это предполагает отсутствие шаблонов угадывания, поэтому люди не различаются в том, как они угадывают, а предметы не отличаются в том, как они угадываются, поэтому угадывание является чисто случайным.


В этом есть смысл! Хотя я думаю, что вы могли бы вычислить вероятность вероятности успеха вопроса, но «способность людей» звучит сложно :) Другая идея, которая у меня была, состоит в том, чтобы смоделировать это как сумму распределений Бернулли? Например, скажем, есть 2 вопроса, следовательно, 2 вероятности успеха p1 и p2. Аналогично подсчитываются две переменные X1 и X2 (так 2 эксперимента Бернулли). Тогда, например, вероятность получения одного общего балла 1 равна P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1 -1) р2. Это звучит разумно?
Пол

2
@ Сумма Пола двух Бернулли с разными p - пуассоново-биномиальная
Тим

4
«Нулевое» предположение - это в основном сферическая корова, всегда можно поспорить о том, насколько сферической является корова.
Хонг Оои

5

Ответ на эту проблему зависит от формулировки вопроса и когда информация будет получена. В целом, я склонен согласиться с профессором, но думаю, что объяснение его / ее ответа плохое, и вопрос профессора должен включать больше информации заранее.

Если вы рассматриваете бесконечное количество потенциальных экзаменационных вопросов и набираете один случайный для вопроса 1, то выбираете один случайный для вопроса 2 и т. Д. Затем перейдем к экзамену:

  1. Каждый вопрос имеет два результата (правильный или неправильный)
  2. Есть фиксированное количество испытаний (вопросов)
  3. Каждое испытание может считаться независимым (если перейти ко второму вопросу, ваша вероятность получить правильную оценку такая же, как при переходе к первому вопросу)p

В этих рамках допущены условия биномиального эксперимента.

Увы, плохо предложенные статистические проблемы очень распространены на практике, а не только на экзаменах. Я не колеблясь, буду защищать ваше обоснование перед вашим профессором.


Да, я думаю, это тоже правильно. Вопрос просто «плохой», так как вы можете спорить обоими способами, так как так мало информации дается. Но я просто был очень недоволен ответом моего профессора.
Пол

4
@ Пол, на самом деле довольно сложно писать хорошие статистические вопросы. Я знаю, что разболтал во многих случаях.
gung - Восстановить Монику

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Я думаю, вы должны четко указать, что экзаменационные вопросы составляются независимо от совокупности потенциальных вопросов. Для них было бы более реалистично соотносить их: если вопрос 1 является легким, вероятно, вам дают легкий экзамен, а вопрос 2 будет легким.
Адриан

0

Если есть n вопросов, и я могу правильно ответить на любой вопрос с вероятностью p, и у меня будет достаточно времени, чтобы попытаться ответить на все вопросы, и я выполнил 100 из этих тестов, то мои оценки были бы нормально распределены со средним значением np.

Но это не я повторяю тест 100 раз, это 100 разных кандидатов, которые проводят один тест, каждый со своей вероятностью p. Распределение этих р будет основным фактором. Возможно, у вас есть тест, где p = 0,9, если вы хорошо изучили предмет, p = 0,1, если вы этого не сделали, с очень небольшим количеством людей от 0,1 до 0,9. Распределение точек будет иметь очень сильные максимумы при 0,1n и 0,9 n и не будет близко к нормальному распределению.

С другой стороны, существуют тесты, в которых каждый может ответить на любой вопрос, но занимает разное время, поэтому некоторые ответят на все n вопросов, а другие ответят меньше, потому что у них заканчивается время. Если мы можем предположить, что скорость кандидатов нормально распределена, то точки будут близки к нормальному распределению.

Но многие тесты будут содержать некоторые очень сложные и некоторые очень простые вопросы, намеренно, чтобы мы могли различать лучших кандидатов (которые ответят на все вопросы с некоторой степенью сложности) и худших кандидатов (которые смогут ответить только очень простые вопросы). Это очень сильно изменит распределение точек.


2
Нормальное распределение, которое вы описываете здесь, является нормальным приближением бинома. Очевидно, что сумма нулей и единиц не будет непрерывной и будет колебаться между и
Тимом

2
@Tim Несмотря на ненужную зависимость от нормальных распределений и загадку прохождения 100 тестов, этот ответ имеет смысл попытаться продемонстрировать, как конкретный случай может привести к явно небиномиальному распределению. Таким образом, это может быть ценным вкладом в ответы, если эти технические проблемы будут решены.
whuber

0

По определению, биномиальное распределение - это набор из независимых и одинаково распределенных испытаний Бернулли. В случае экзамена с несколькими вариантами ответов каждый из вопросов будет одним из испытаний Бернулли.нn n

Проблема здесь возникает, потому что мы не можем разумно предположить, что вопросов:n

  • Есть одинаково распределены . Как вы сказали, вероятность того, что студент знает ответ на вопрос , почти наверняка не будет такой же, как вероятность того, что он знает ответ на вопрос и так далее.212
  • Является независимым . Многие экзамены задают вопросы, которые основаны на ответах на предыдущий вопрос (ы). Кто может сказать наверняка, что этого не произойдет на экзамене по этому вопросу? Есть и другие факторы, которые могут дать ответы на экзаменационные вопросы, не зависящие друг от друга, но я думаю, что этот наиболее интуитивно очевиден.

Я видел вопросы в классах статистики, которые моделируют экзаменационные вопросы в виде биномов, но они выглядят так:

Какое распределение вероятностей будет моделировать количество вопросов, на которые правильно ответили на экзамене с несколькими вариантами ответов, где у каждого вопроса есть четыре варианта выбора, и учащийся, сдающий экзамен, угадывает каждый ответ наугад?

В этом сценарии, конечно, он будет представлен в виде биномиального распределения с .p=14


С вашими фактами все в порядке, но логика неверна: недостаточно продемонстрировать, что некоторые допущения могут не выполняться, поскольку (логически) распределение все равно может быть биномиальным в любом случае. Вы также должны продемонстрировать, что эти допущения могут быть неверными, что приведет к тому, что распределение баллов определенно будет не биномиальным.
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.