Хотя я чувствую себя немного застенчивым, противоречащим как «уважаемому тексту», так и другому пользователю резюме, мне кажется, что формула Спирмена-Брауна не зависит от наличия предметов различной сложности. Безусловно, формула Спирмена-Брауна обычно выводится из предположения, что у нас есть параллельные предметы, что подразумевает (среди прочего), что предметы имеют одинаковую сложность. Но оказывается, что это предположение не является необходимым; это может быть смягчено, чтобы позволить неравные трудности, и формула Спирмена-Брауна все еще сохранится. Я продемонстрирую это ниже.
Напомним, что в классической теории испытаний измерение считается суммой компонента «истинной оценки» и компонента ошибки , то есть
причем и коррелированы. Предположение о параллельных элементах состоит в том, что все элементы имеют одинаковые истинные оценки, отличающиеся только компонентами ошибок, хотя предполагается, что они имеют одинаковую дисперсию. В символах, для любой пары элементов иXTE
X=T+E,
TEXX′T=T′var(E)=var(E′).
Давайте посмотрим, что произойдет, когда мы ослабим первое предположение, так что элементы могут различаться по своим трудностям, а затем получим достоверность общего балла теста в соответствии с этими новыми допущениями. В частности, предположим, что истинные оценки могут отличаться на аддитивную константу, но ошибки по-прежнему имеют одинаковую дисперсию. В символах
Любые различия в сложности фиксируются аддитивной константой. Например, если , то баллы по имеют тенденцию быть выше, чем баллы по , так что «легче», чем . Мы могли бы назвать их по
существу параллельнымиT=T′+c′var(E)=var(E′).
c′>0XX′XX′предметы, по аналогии с предположением «существенной тау-эквивалентности», которая аналогичным образом ослабляет тау-эквивалентную модель.
Теперь для определения достоверности формы испытаний таких предметов. Рассмотрим тест, состоящий из существу параллельных элементов, сумма которых дает оценку теста. Надежность, по определению, представляет собой отношение истинной дисперсии баллов к наблюдаемой дисперсии баллов. Что касается надежности отдельных элементов, то из определения существенного параллелизма следует, что они имеют одинаковую надежность, которую мы обозначаем с помощью и - истинная дисперсия баллов и - дисперсия ошибок. Для достоверности итоговой оценки, мы сначала исследуем дисперсию итоговой оценки, которая равна
kρ=σ2T/(σ2T+σ2E)σ2Tσ2E
var(∑i=1kTi+Ei)=var(∑i=1kT+ci+Ei)=k2σ2T+kσ2E,
,
где (не нижний индекс) любое произвольное верно оценка , что истинные оценки всех элементов меню могут быть сдвинуты к через их точки зрения постоянных, является истинная дисперсия баллов, а - дисперсия ошибок. Обратите внимание, что постоянные условия выпадают! Это ключ. Таким образом, достоверность итоговой оценки за тест составляет
Tσ2Tσ2Ek2σ2Tk2σ2T+kσ2E=kσ2Tkσ2T+σ2X−σ2T=kρ1+(k−1)ρ,
это просто классическая формула Спирмена-Брауна, без изменений. Это показывает, что даже при изменении «сложности» предметов, определяемых как их средние баллы, формула Спирмена-Брауна все еще сохраняется.
@JeremyMiles поднимает несколько интересных и важных моментов о том, что может произойти, когда мы увеличиваем продолжительность теста «в реальном мире», но, по крайней мере, в соответствии с идеализированными предположениями классической теории испытаний, вариации в сложности предметов не имеют значения для надежности Форма теста (в резком контрасте с предположениями современной теории ответа предмета!). Эта же основная линия рассуждения также объясняет, почему мы обычно говорим о существенной тау-эквивалентности, а не тау-эквивалентности, потому что большинство всех важных результатов справедливо для более мягкого случая, когда трудности с предметом (т. Е. Средние) могут различаться.