Должен ли я учить байесовской или частой статистике в первую очередь?


32

Я помогаю своим мальчикам, которые в настоящее время учатся в старших классах, разбираться в статистике, и я собираюсь начать с нескольких простых примеров, не забывая о проблесках теории.

Моя цель состояла бы в том, чтобы дать им наиболее интуитивный, но в то же время инструментальный подход к изучению статистики с нуля, чтобы стимулировать их интерес к дальнейшему изучению статистики и количественного обучения.

Прежде чем начать, у меня есть конкретный вопрос с очень общими последствиями:

Должны ли мы начать преподавать статистику, используя байесовские или частые рамки?

Исследуя вокруг, я увидел, что общий подход начинается с краткого введения в статистику частых случаев, за которым следует углубленное обсуждение статистики Байеса (например, Stangl ).


5
На ваш вопрос сложно ответить без контекста. Чего бы вы хотели достичь?
Glen_b

4
Плохое воспитание детей - учить детей байесовской статистике, сродни наливанию им водки или разжиганию сигар. Обратите внимание, что и водка, и сигары хороши для взрослых, если они обнаруживают их самостоятельно
Аксакал,

2
@Aksakal На самом деле я планировал научить их теореме Байеса, потягивая водку и выпивая гаваны ... ;-)
Joe_74

2
Это хороший способ уберечь ребенка от байесовской статистики на несколько лет. Вы говорите им, что это просто приложения теоремы Байеса. Теорема отлично работает в статистике частых
Аксакал

5
Книга Нейта Сильвера «Сигнал и шум» дает основание для обучения молодежи байесовской статистике.
Ллойд Рождество

Ответы:


25

И байесовская статистика, и статистика частых основаны на теории вероятностей, но я бы сказал, что первая с самого начала в большей степени опирается на теорию. С другой стороны, концепция достоверного интервала, несомненно, является более интуитивной, чем концепция доверительного интервала, если студент хорошо понимает концепцию вероятности. Итак, что бы вы ни выбрали, я в первую очередь отстаиваю их понимание концепций вероятности, причем все эти примеры основаны на игре в кости, карточках, рулетке, парадоксе Монти Холла и т. Д.

Я бы выбрал тот или иной подход, основанный на чисто утилитарном подходе: с большей ли вероятностью они изучают статистику по частоте или байесовской школе? В моей стране, они определенно изучали бы основы для частых (в первую очередь: никогда не слышали о том, чтобы учащиеся старших классов преподавали байесовскую статистику, единственный шанс - либо в университете, либо после, путем самостоятельного обучения). Может быть, у вас все по-другому. Имейте в виду, что если им нужно иметь дело с NHST (тестирование значимости нулевой гипотезы), то это более естественно возникает в контексте статистики частых случаев, IMO. Конечно, вы можете проверить гипотезы также в байесовской структуре, но есть много ведущих байесовских статистиков, которые выступают за то, чтобы вообще не использовать NHST, ни в рамках частых, ни в байесовских рамках (например, Эндрю Гельман из Колумбийского университета).

Наконец, я не знаю об уровне старшеклассников в вашей стране, но для меня было бы очень трудно успешно усвоить (основы) теории вероятностей и интегрального исчисления одновременно. Итак, если вы решите использовать байесовскую статистику, я бы действительно избегал случая с непрерывной случайной величиной и придерживался дискретных случайных величин.


2
У меня сложилось впечатление (после прочтения его блога), что Эндрю Гельман будет выступать как против частого NSHT, так и против байесовского.
Псарка

2
@psarka да, конечно - я никогда не говорил обратного.
DeltaIV

3
«В моей стране они, безусловно, сначала изучат частые рамки» - это (или вообще не упоминание о байесианстве) традиционный подход во всем мире.
Кодиолог

1
@ Кодиолог, я так и подозревал. По крайней мере, могут существовать некоторые образовательные системы, в которых после частых рамок в старших классах вводится также байесовская система. Но здесь дело не в этом.
DeltaIV

22

Байесовский и частый задают разные вопросы. Байесовский спрашивает, какие значения параметров заслуживают доверия, учитывая наблюдаемые данные. Частый участник спрашивает о вероятности воображаемых смоделированных данных, если некоторые гипотетические значения параметров были истинными. Частые решения мотивируются контролем ошибок, байесовские решения мотивированы неопределенностью в описаниях моделей.

Итак, чему вы должны учить в первую очередь? Что ж, если вы хотите задать один или другой из этих вопросов, это ваш ответ. Но с точки зрения доступности и педагогики, я думаю, что байесовский гораздо проще для понимания и гораздо более интуитивно понятен. Основная идея байесовского анализа - это перераспределение правдоподобия между возможностями, как, как сказал Шерлок Холмс, и которое миллионы читателей интуитивно поняли. Но основная идея частого анализа очень сложна: пространство всех возможных наборов данных, которые могли бы произойти, если бы конкретная гипотеза была верной, и доля тех мнимых наборов данных, которые имеют сводную статистику как экстремальную статистику или более статистика, которая действительно наблюдалась.

Бесплатная вводная глава о байесовских идеях находится здесь . Статья , которая устанавливает и байесовская частотную концепции рядом находится здесь . В статье объясняются частый и байесовский подходы к проверке гипотез и оценке (и многое другое). Рамки статьи могут быть особенно полезны для начинающих, пытающихся получить представление о ландшафте.


Включение заголовков главы и статьи может быть полезным в случае, если ссылки в будущем прекратят работу.
Ричард Харди

8

Этот вопрос может быть основан на мнении, поэтому я постараюсь быть очень кратким с моим мнением, а затем предложу вам книгу. Иногда стоит придерживаться определенного подхода, потому что это подход, который использует особенно хорошая книга.

Я согласен, что байесовская статистика более интуитивна. Различие между доверительным интервалом и доверительным интервалом в значительной степени подводит итог: люди, естественно, думают в терминах «какова вероятность того, что ...», а не как подход с доверительным интервалом. Подход доверительного интервала звучит так, как будто он говорит то же самое, что и доверительный интервал, за исключением того, что по общему принципу вы не можете сделать последний шаг от «95% времени» до «95% шансов», что кажется очень частым, но вы не могу сделать это Это не противоречиво, просто не интуитивно понятно.

Уравновешивание этого факта - то, что большинство курсов колледжа, которые они выберут, будет использовать менее интуитивный частый подход.

Тем не менее, мне очень нравится книга « Статистическое переосмысление: байесовский курс с примерами на R и Stan » Ричарда МакЭлрита. Это не дешево, поэтому, пожалуйста, прочитайте об этом и покопайтесь в нем на Amazon, прежде чем купить. Я считаю это особенно интуитивным подходом, который использует преимущества байесовского подхода и очень практичен. (А поскольку R и Stan являются отличными инструментами для байесовской статистики, и они бесплатны, это практическое обучение.)

РЕДАКТИРОВАТЬ: В нескольких комментариях упоминается, что книга, вероятно, выходит за рамки High Schooler, даже с опытным преподавателем . Поэтому мне придется разместить еще большую оговорку: вначале у нее простой подход, но он быстро нарастает. Это удивительная книга, но вам действительно, действительно, придется просмотреть ее на Amazon, чтобы понять ее первоначальные предположения и то, как быстро она набирает обороты. Прекрасные аналогии, отличная практическая работа в R, невероятный поток и организация, но, возможно, бесполезный для вас.

Он предполагает базовые знания в области программирования и R (бесплатный статистический пакет), а также некоторые знания основ вероятности и статистики. Это не произвольный доступ, и каждая глава основана на предыдущих главах. Он начинается очень просто, хотя сложность нарастает посередине - он заканчивается многоуровневой регрессией. Так что вы можете просмотреть некоторые из них на Amazon и решить, сможете ли вы легко охватить основы или они слишком далеко зашли в будущем.

РЕДАКТИРОВАТЬ 2: Суть моего вклада в этом и попытка превратить его из чистого мнения в том, что хороший учебник может решить, какой подход вы выберете. Я бы предпочел байесовский подход, и эта книга делает это хорошо, но, возможно, в слишком быстром темпе.


2
Книга Макилриса превосходна, но я был бы очень удивлен, если бы ученики старших классов смогли пройти такой уровень лечения даже с талантливым преподавателем.
DeltaIV

2
@DeltaIV: Хороший отзыв, я отредактирую свой ответ. Меня несколько раз одурачили тем, насколько поначалу это читабельно и аналогично. Это действительно крутой курс обучения примерно на полпути, и, вероятно, намного раньше, чем это.
Уэйн

1
Еще одно замечание: я думаю, что существует больший разрыв между основами (т. Е. Теорией вероятностей) и применением в методах Frequentist над байесовскими методами. То есть мне трудно представить, что кто-то действительно понимает теорию MLE, доказательство CLT и т. Д., Без обучения на уровне выпускника, которое требуется даже для самых элементарных процедур для часто встречающихся. Когда вы знаете условную вероятность, вы в основном понимаете, как работает байесовский вывод. Теория MCMC немного сложнее, но, честно говоря, намного проще, чем истинное понимание теории MLE ...
Клифф А.Б.

... и поскольку легче преодолеть разрыв между вероятностью и применением статистики в байесовской структуре, по крайней мере, я думаю, что это делает вещи более удовлетворяющими умственные способности быстрее. Я ненавидел занятия по ТА, на которых мы должны были сказать «и доверяйте нам, теория MLE работает с большими выборками», поскольку я чувствовал, что это должно несколько убить чье-то научное любопытство или потребовать гораздо большего умственного участия.
Клифф AB

... Но интуиция за mle достаточно естественна ... stats.stackexchange.com/questions/112451/…
kjetil b halvorsen

5

Сначала меня научили частому подходу, а затем байесовскому. Я не профессиональный статистик.

Я должен признать, что мои предыдущие знания о подходе, основанном на частоте, не были столь полезными для понимания байесовского подхода.

Я бы осмелился сказать, что это зависит от того, какие конкретные приложения вы будете показывать своим ученикам дальше, и сколько времени и усилий вы на них потратите.

Сказав это, я бы начал с Байеса.


3

Байесовская структура тесно связана с общими навыками критического мышления. Это то, что вам нужно в следующих ситуациях:

  1. Вы думаете о подаче заявки на конкурсную работу. Каковы ваши шансы попасть? Какую отдачу вы ожидаете от подачи заявления?
  2. Заголовок говорит вам, что мобильные телефоны вызывают рак у людей в долгосрочной перспективе. Сколько доказательств у них есть для этого?
  3. Какой благотворительности вы должны пожертвовать деньги, если хотите, чтобы они имели наибольший эффект?
  4. Кто-то предлагает подбросить монету со ставкой 0,90 доллара от вас и 1,10 доллара от них. Вы бы дали им деньги? Почему, почему нет?
  5. Вы потеряли свои ключи (или атомную бомбу). Где вы начинаете искать?

Кроме того, это гораздо интереснее, чем запоминание формулы для t-критерия из двух примеров: p. Что увеличивает вероятность того, что студенты будут оставаться заинтересованными достаточно долго, чтобы заниматься все более и более техническими материалами.


3

Никто не упомянул вероятность, которая является фундаментальной для байесовской статистики. Во-первых, аргумент в пользу преподавания Байеса заключается в том, что путь от вероятности к вероятности к Байесу довольно плавный. Байес может быть мотивирован от вероятности, отмечая, что (i) функция правдоподобия выглядит (и действует) как функция распределения вероятностей, но не потому, что площадь под кривой не равна 1,0, и (ii) грубый, обычно используемый Вальд интервалы предполагают функцию правдоподобия, которая пропорциональна нормальному распределению, но байесовские методы легко преодолевают это ограничение.

Еще один аргумент в пользу байесовского подхода заключается в том, что обеспокоенность P (A | B) и P (B | A) в отношении p-значений можно объяснить более легко, как уже упоминалось другими.

Еще один аргумент в пользу «Байеса прежде всего» заключается в том, что он заставляет студентов более тщательно продумывать модели условной вероятности, что полезно в других местах, например, в регрессионном анализе.

Извините за саморекламу, но, поскольку она полностью посвящена теме, я не против заявить, что именно такой подход мы и Кевен Хеннинг использовали в нашей книге «Понимание передовых статистических методов» ( https: // peterwestfall. wixsite.com/book-1 ), чья целевая аудитория не является статистикой.


2

Вы учите для развлечения и понимания или для практического использования? Если бы речь шла об обучении и понимании, я бы пошел в Байес. Если бы в практических целях я бы определенно пошел на частую работу.

Во многих областях - и я предполагаю, что в большинстве областей - естественных наук люди используют для публикации своих работ с p-значением. Вашим «мальчикам» придется читать чужие газеты, прежде чем они начнут писать свои собственные. Чтобы читать статьи других людей, по крайней мере, в моей области, им нужно понимать нулевые гипотезы p-значений, какими бы глупыми они ни казались после байесовских исследований. И даже когда они будут готовы опубликовать свою первую статью, у них, вероятно, будет какой-то старший научный сотрудник, возглавляющий команду, и, скорее всего, они предпочитают частоту.

При этом я хотел бы согласиться с @Wayne, в котором статистическое переосмысление показывает очень четкий путь к байесовской статистике в качестве первого подхода, а не на основе существующих знаний о частотности. Прекрасно, что эта книга не пытается убедить вас в борьбе с лучшей или худшей статистикой. Заявленный аргумент автора для Байеса (IIRC) состоит в том, что он учил обоим видам, и Байесу было легче учить.


2

Я бы держался подальше от Байеса, следовал за гигантами.

У Советов была отличная серия книг для учеников средней школы, примерно переведенная на английский как «Квант», маленькая библиотека ». Колмогоров подарил книгу с соавторами под названием «Введение в теорию вероятностей». Я не уверен, что он когда-либо был переведен на английский, но вот ссылка на его русский оригинал.

Они подходят к объяснению вероятностей с помощью комбинаторики, и я думаю, это отличный способ начать. Книга очень доступна для старшеклассников с приличной математикой. Заметьте, что Советы преподавали математику довольно широко, поэтому средние ученики старших классов западной школы, возможно, не так хорошо подготовлены, но с достаточным интересом и силой воли все еще могут справиться с содержанием, на мой взгляд.

Контент очень интересен для студентов, он имеет случайные прогулки, ограниченное распределение, процессы выживания, закон больших чисел и т. Д. Если вы объедините этот подход с компьютерным моделированием, он станет еще более увлекательным.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.