Вот одна из возможностей.
Оценка работы учителя традиционно была трудной. Одна часть этой трудности заключается в том, что разные студенты имеют разные уровни интереса к данному предмету. Если конкретный ученик получает оценку «А», это не обязательно означает, что преподавание было превосходным, скорее, это может означать, что очень одаренный и заинтересованный ученик делал все возможное, чтобы добиться успеха, даже несмотря на низкое качество преподавания. И наоборот, студент, получивший оценку D, не обязательно означает, что преподавание было плохим, скорее, это может означать, что незаинтересованный студент продолжил курс обучения, несмотря на все усилия учителя по обучению и вдохновению.
Трудность усугубляется тем фактом, что отбор учащихся (и, следовательно, уровень их заинтересованности) далеко не случаен. В школах принято подчеркивать один предмет (или группу предметов) над другими. Например, школа может акцентировать внимание на технических предметах, а не на гуманитарных. Ученики в таких школах, вероятно, настолько заинтересованы в технических областях, что они получат проходную оценку даже с самым худшим учителем. Таким образом, доля студентов, проходящих математику, не является хорошей мерой обучения - мы ожидаем, что хорошие учителя будут делать намного лучше, чем студенты, которые так хотят учиться. Напротив, те же самые студенты могут вообще не интересоваться искусством. Трудно ожидать, что даже от самого лучшего учителя все ученики получат «отлично».
Другая трудность заключается в том, что не все успехи в данном классе напрямую связаны с учителем этого класса. Скорее, успех может быть связан с тем, что школа (или весь округ) создает мотивацию и основу для достижения.
Чтобы учесть все эти трудности, исследователи создали модель, которая оценивает «добавленную стоимость» учителя. По сути, модель учитывает внутренние характеристики каждого учащегося (общий уровень интереса и успехи в обучении), а также вклад школы и округа в успех учащихся и прогнозирует ожидаемые оценки учащихся со «средним». обучение в этой среде. Затем модель сравнивает фактические оценки с прогнозируемыми и на основании этого решает, было ли обучение адекватным, учитывая все другие соображения: лучше, чем адекватно, или хуже. Хотя для нематематика модель может показаться сложной, на самом деле она довольно проста и стандартна. Математики использовали подобные (и даже более сложные) модели на протяжении десятилетий.
Подводя итог, предположение мисс Исааксон является правильным. Несмотря на то, что 65 из 66 ее учеников набрали квалификационный балл по государственному тесту, они получили бы такой же результат, даже если бы их учителем была собака. Фактически хороший учитель позволил бы этим студентам достигать не просто «опытных», но фактически «хороших» баллов по одному и тому же тесту.
На данный момент я могу упомянуть некоторые из моих проблем с моделью. Например, разработчики модели утверждают, что это устраняет некоторые трудности с оценкой качества обучения. У меня достаточно причин, чтобы верить им? Окрестности с населением с более низким доходом будут иметь более низкие ожидаемые оценки «район» и «школа». Скажем, район будет иметь ожидаемый счет 2,5. Учитель, который наберет в среднем 3 балла, получит хорошую оценку. Это может побудить учителей стремиться к баллу 3, а не к, скажем, 4 или 5. Другими словами, учителя будут стремиться к посредственности, а не к совершенству. Мы хотим, чтобы это случилось? Наконец, хотя модель математически проста, она работает совершенно не так, как работает человеческая интуиция. В результате у нас нет очевидного способа проверить или оспорить модель ». решение. Неудачный пример мисс Айзексон иллюстрирует, к чему это может привести. Мы хотим слепо зависеть от компьютера в чем-то столь важном?
Обратите внимание, что это объяснение для непрофессионала. Я обошел несколько потенциально спорных вопросов здесь. Например, я не хотел сказать, что школьные округа с низкими доходами, как ожидается, будут работать хуже, потому что это не будет хорошо для непрофессионала.
Кроме того, я предположил, что цель состоит в том, чтобы дать достаточно справедливое описание модели. Но я уверен, что это не было целью Нью-Йорк Таймса. Так что, по моему мнению, по крайней мере, одна из причин, по которой их объяснение плохое, - это преднамеренное ФУД.