Являются ли студенты с более высокими оценками, которые получают более высокие баллы на повторных тестах?
Вопрос получил существенное редактирование с момента последнего из шести ответов.
Отредактированный вопрос содержит пример регрессии к среднему значению в контексте оценок учеников по тесту « вопросов истинно-ложно» и повторной проверки лучших исполнителей на эквивалентном тесте. Повторный тест показывает значительно больше средних баллов для группы лучших исполнителей в первом тесте. В чем дело? Были ли студенты обманывать в первый раз? Нет, важно контролировать регрессию до среднего. Тестирование производительности для тестов с множественным выбором - это комбинация удачи в угадывании и способности / знания Некоторая часть оценок лучших исполнителей была обусловлена удачей, которая не обязательно повторялась во второй раз.100
Или они должны просто держаться подальше от колеса рулетки?
Давайте сначала предположим, что никаких навыков не было, что учащиеся просто подбрасывали (честные) монеты, чтобы определить свои ответы. Какова ожидаемая оценка? Итак, каждый ответ имеет
вероятности быть правильным, поэтому мы ожидаем от или баллов .50%50%10050
Но это ожидаемая ценность. Некоторые добьются большего успеха просто случайно. Вероятность правильной оценки не менее соответствии с биномиальным распределением составляет примерно . Таким образом, в группе из учеников ожидаемое число учеников, получающих оценку или выше, составляет .60%2.8%30006085
Теперь давайте предположим, что на самом деле было студентов с оценкой или выше, и проведем повторную проверку. Каков ожидаемый результат при повторном тестировании по тому же методу бросания монет? Это все еще от ! Какова вероятность того, что студент, прошедший повторное тестирование таким образом, получит оценку выше ? Это все еще ! Таким образом, мы должны ожидать, что только из ( ) наберут как минимум при повторном тестировании.8560%50%10060%2.8%2852.8%⋅8560%
При такой настройке ошибочно предполагать, что ожидаемый балл при повторном тестировании отличается от ожидаемого балла в первом тесте - они оба составляют от . Ошибка игрока состоит в том, что он полагает, что удача студентов с высокими баллами с большей вероятностью будет компенсирована неудачей при повторном тестировании. При таком заблуждении вы ставите на ожидаемые результаты повторного тестирования ниже . Ошибочное мнение (здесь) может заключаться в том, что удача учеников с высокими баллами, скорее всего, продолжится, и ставка на ожидаемые результаты повторного тестирования будет выше .50%1005050
Счастливые монеты и счастливые сальто
Реальность немного сложнее. Давайте обновим нашу модель. Во-первых, не имеет значения, какие будут реальные ответы, если мы просто подбрасываем монеты, поэтому давайте просто наберем количество голов. Пока что модель эквивалентна. Теперь давайте предположим, что монет склонны быть головами с вероятностью (хорошие монеты ),
монет склонны быть головами с вероятностью (плохие монеты ), а имеют равную вероятность быть головами или хвосты (ярмарка монет100055%G100045%B1000F) и случайным образом распределить их. Это аналогично предположению о более высоких и более низких способностях / знаниях в тестовом примере, но легче правильно рассуждать о неодушевленных предметах.
Ожидаемый балл для любого учащегося с учетом случайного распределения. Таким образом, ожидаемый результат первого теста не изменился. Теперь вероятность правильного выигрыша не менее , опять-таки с использованием биномиального распределения, составляет для хороших монет,
для плохих монет и, конечно, для справедливых монет. Вероятность выигрыша, по крайней мере, составляет , поскольку случайным образом распределено одинаковое количество монет каждого типа, их среднее значение или . Ожидаемое количество студентов, набравших не менее составляет .(55⋅1000+45⋅1000+50⋅1000)/3000=5060%18.3%0.2%2.8%60%7.1%60%21
Теперь, если у нас действительно есть выигрыш, по крайней мере, при такой настройке смещенных монет, каков ожидаемый результат при повторном тестировании? Больше не от ! Теперь вы можете решить это с помощью теоремы Байеса, но, поскольку мы использовали группы одинакового размера, вероятность наличия типа монеты для данного результата (здесь) пропорциональна вероятности результата для данного типа монеты. Другими словами, есть вероятность что те, кто набрал не менее 60%, имели хорошую монету, имели плохую монету, а имели хорошую монету. Таким образом, ожидаемое значение баллов при повторном тестировании2160%50%10086%=18.3%/(18.3%+0.2%+2.8%)1%=0.2%/(18.3%+0.2%+2.8%)13%86%⋅55+1%⋅45+13%⋅50=54.25 из . Это ниже, чем фактические результаты первого раунда, по крайней мере, , но выше, чем ожидаемое значение очков перед первым туром, .1006050
Таким образом, даже если некоторые монеты лучше других, случайность в монетах переворачивается, что означает, что выбор лучших исполнителей из теста все равно будет демонстрировать некоторую регрессию к среднему значению при повторном тестировании. В этой модифицированной модели «горячие руки» больше не являются явной ошибкой - лучший результат в первом раунде означает более высокую вероятность получения хорошей монеты! Однако заблуждение игрока остается ошибкой - нельзя ожидать, что те, кто испытал удачу, получат компенсацию за неудачу при повторном тестировании.