Вывод для скептического (но не математического) читателя


14

Я только что посмотрел лекцию по статистическому выводу («сравнение пропорций и средних»), часть вводного курса по статистике онлайн. Материал имел для меня такой же малый смысл, как и всегда (к настоящему времени я, должно быть, видел это десятки раз за последние три десятилетия).

Я ищу книгу «Базовая статистика-101» (точечная оценка, оценочная оценка, статистический вывод, проверка гипотез, дизайн исследования), которая серьезно относится к проблеме убеждения скептического читателя ...

Ниже я привожу несколько примеров того типа вопроса, который автор, которого я ищу, воспринимает всерьез и знает, как ответить на него убедительно.

Но сначала позвольте мне выделить минуту, чтобы подчеркнуть, что в этом посте я не задаю эти вопросы. Пожалуйста, не отвечайте на них! Я даю их только в качестве примеров и в виде «лакмусовой бумажки» (для типа автора, который ищет).

  1. Если «пропорция» является просто средним значением булевой переменной (то есть той, которая принимает только значения 0 и 1), почему учат различным процедурам для статистического вывода с помощью «пропорций» и «средних»?

  2. Если нормальное распределение настолько устойчиво, что допущение нормальности дает хорошие результаты даже в тех случаях, когда эти данные распределены не совсем нормально, и если t-распределение выглядит так нормально, почему все возни об использовании t-распределения вместо обычный?

  3. Что именно «степени свободы» и почему мы беспокоимся о них?

  4. Что значит говорить об «истинном» значении параметра, учитывая, что мы просто используем распределения, которые выглядят похожими на данные?

  5. Почему «предварительный анализ данных» - это хорошо, а «отслеживание данных» - зло?

Как я уже сказал, меня откладывает отношением, которое подразумевается пренебрежением такими вопросами. Это не «эпистемологическая позиция», которую я хочу видеть в том, кто меня чему-то учит. Я ищу авторов, которые уважают скептицизм и рациональность читателя и знают, как к ним обращаться (без необходимости переходить на страницы и страницы формализма и технических подробностей).

Я понимаю, что это сложный заказ, и, может быть, особенно, когда дело касается статистики. Поэтому я не ожидаю, что многим авторам это удастся. Но на данный момент я буду доволен поиском только одного .

Позвольте мне добавить, что я не склонен к математике. Наоборот, я люблю математику. (Я доволен анализом [он же «расширенное исчисление»), линейной алгеброй, теорией вероятностей, даже теорией элементарных мер.)

Тем не менее, мой интерес в настоящее время к статистике «прикладной», «практической», «повседневной», «реальной» (в отличие от теоретических тонкостей). (Но я не хочу кулинарную книгу!)

FWIW, я прочитал первые несколько глав анализа данных с использованием регрессионных и многоуровневых / иерархических моделей Гелмана и Хилла, и мне нравится тон авторов. Их цель практична, но при необходимости углубляйтесь в теорию. Они также часто отступают, критически оценивают стандартную практику и высказывают откровенные мнения, обращающиеся к здравому смыслу скептического читателя. К сожалению, эти авторы не написали книгу, посвященную теме, о которой я спрашиваю в этом посте (материал «Stats 101», как описано выше). Мне также известно, что один из этих авторов (Гельман) стал соавтором высоко оцененного анализа байесовских данных. , но, опять же, это не то, что я ищу в данный момент.

РЕДАКТИРОВАТЬ:

Дикран Marsupial выдвигает следующее возражение:

Я не думаю, что с пренебрежением вопросами обязательно что-то не так, наступает момент, когда решение каждого вопроса отвлекает от изложения основных понятий, что зачастую является более важным (особенно в книге статистики 101!).

Я согласен с этим. Для меня было бы точнее сказать, что я ищу «второй взгляд на основную статистику». На самом деле, с этой мотивацией я посмотрел учебники, используемые на курсах для аспирантов по умозаключению (скажем), и обнаружил, что они слишком пренебрегали вопросами, подобными тем, которые я перечислил. Во всяком случае, они казались еще менее склонными вникать в такие вопросы (чтобы они могли сосредоточиться на таких вопросах, как условия некоторой конвергенции или того или иного из этого или того ...).

Проблема в том, что более продвинутые книги адресованы радикально различному кругу читателей, в которых «скептицизм постороннего» резко истощился. Итак, те, кто берут статистику на уровне выпускников, зашли в тупик из-за вопросов, которые меня беспокоят, Они больше не скептически относятся ни к чему из этого. (Как они преодолели горб скептицизма? Может быть, некоторые из них никогда не были слишком критичны, особенно, если они узнали свою статистику довольно рано - я знаю, что сам я не был особенно критичным новичком, например, хотя я этого не делал возьмите статистику тогда. У других, возможно, были учителя, которые заполнили, где их учебники терпели неудачу. Некоторые, возможно, были достаточно умны, чтобы выяснить ответы на такие вопросы для себя. Кто знает.)


2
На большинство этих вопросов, на которые мы не должны отвечать, есть хорошие ответы уже здесь, в резюме. На некоторые из этих вопросов даже есть довольно тривиальные ответы. Но есть тысяча вопросов, которые люди задают по любой теме - вы никогда не найдете объяснения, охватывающего все возможные вопросы, и при этом вы не найдете такого, который предвосхищает только те конкретные вопросы, которые возникают у вас во время просмотра или чтение. Ну, вы можете ударить один или два случайно, но в целом это невозможный стандарт. Почему бы просто не задавать вопросы по мере их возникновения? На сайте, который отвечает на вопросы?
Glen_b

2
Я скажу, что подобные вопросы возникают, когда люди ведут статистику (и некоторые книги отвечают на некоторые из них), но большинство из них не являются актуальными вопросами, связанными со скептицизмом - в основном это простые вопросы понимания. например, «что такое степени свободы и почему мы заботимся» вовсе не скептически, а требует ясности объяснения и мотивации. Причины, по которым опытные пользователи статистики не беспокоятся об этом, заключаются в том, что они уже понимают, почему они так ценны.
Glen_b

Ответы:


6

У вас уже есть несколько хороших предложений. Вот еще немного. Во-первых, два блога, которые я читаю время от времени, и где иногда обсуждаются такие вопросы, как вы сами. Поскольку они являются блогами, вы можете даже задавать вопросы и получать очень хорошие ответы! Вот они идут:

http://andrewgelman.com/ (Эндрю Гельман)

http://errorstatistics.com/ (Дебора Майо)

И несколько книг, я думаю, помогут вам: Box, Hunter & Hunter: Статистика для экспериментаторов.

Как следует из названия, это («первый», но действительно, действительно ... второй) курс для людей, которые хотели бы разработать свои собственные эксперименты и проанализировать их. Очень высоко в части «почему».

Затем: Д.Р. Кокс: Принципы статистического вывода, еще одна очень хорошая книга о "почему", а не "как".

И, поскольку вы спрашиваете, почему средства и пропорции трактуются по-разному, вот книга, которая этого не делает: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = книга и т = UTF8 & QID = 1373395118 & стер = 1-1 & ключевые слова = вольноотпущенник + статистика

Низко на математике, высоко на принципах.


8

Я скорее сомневаюсь, что будет одна книга, которая подходит вам, поскольку отдельные люди склонны скептически относиться к разным вещам, и книги написаны для целевой аудитории, а не для отдельных людей. Это одна из хороших вещей в обучении человеком, а не просто книга, которая заключается в том, что вы можете задавать вопросы по ходу дела. Это довольно сложно сделать в линейном тексте.

Я не думаю, что с пренебрежением вопросами обязательно что-то не так, наступает момент, когда решение каждого вопроса отвлекает от изложения основных понятий, что зачастую является более важным (особенно в книге статистики 101!).

Я подозреваю, что лучший подход - это получить хорошую книгу, а затем поискать ответы на оставшиеся без ответа вопросы в другом месте. Передо мной стоит книжная полка со статистическими текстами, просто потому, что ни один из них в отдельности - это не все, что мне нужно (даже книга Джейнса; о).

Для абсолютного новичка я думаю, что книга Гранта Фостера «Понимание статистики» - хорошее место для начала, но я подозреваю, что в этом случае она слишком проста.


1
«Я не думаю, что в пренебрежении вопросами обязательно что-то не так ...» Я думаю, что это справедливое возражение; Я добавил РЕДАКТИРОВАТЬ к своему сообщению, чтобы обратиться к нему.
kjo

7

XΘXΘΘXtXΘ


5
+1 Большая часть причины, по которой статистические процедуры кажутся сомнительными, заключается в том, что они довольно нелогичны, и историческая оценка того, как статистика оказалась такой, какой она есть, вероятно, является хорошим подходом для скептиков.
Дикран Сумчатый

2
@DikranMarsupial: На самом деле, я прочитал «Историю статистики» Стиглера именно для того, чтобы понять причину моих трудностей со статистикой. И это помогло некоторым. К сожалению, это исключает большую часть эпохи Фишера и Неймана, когда (я подозреваю) возникла большая часть извращенной причудливости. Я попробовал около 50 страниц книги Халда, но обнаружил, что его выводы невозможно отследить: они были явно адресованы читателям, обладающим значительным статистическим опытом ... Если подумать, я думаю, что книга адресована образованному неспециалисту и озаглавлена ​​«Почему статистика такая странная? будет хорошо продаваться ... :)
kjo

4
ИМХО, контр-интуитивность статистики предшествует эпохе Фишера против Неймана (хотя интуитивность не подразумевает полезности или наоборот). Книги Яна Хаккинга, возможно, стоит попробовать, мне понравилось «Появление вероятности». Я считаю, что байесовскую статистику гораздо легче понять концептуально, чем статистику, основанную на частоте, но гораздо труднее выполнить на практике. Понимание различий между байесовским и частотным подходами очень помогло мне в понимании частотного подхода.
Дикран Marsupial

1
Спасибо, я проверю Взлом. Его книги долгое время были в моих глазах, хотя я откладывал чтение его, думая, что он больше сосредоточен на философии теории вероятностей (предмет, который я считаю интересным сам по себе). Тем не менее, я признаю, что, по крайней мере, некоторые из моих проблем со статистикой мешают интерпретации вероятности, поэтому, возможно, чтение Взлома позаботится, по крайней мере, о некоторых моих возражениях.
kjo

2
@kjo Я прочитал логику статистического вывода Хаккинга и нашел ее очень «философской» - он задумывался о вероятности «поддержки» и упал на Неймана-Пирсона, но продолжал с простыми примерами - не обсуждал неприятные параметры, мульти вывод параметров, или что-нибудь хитрое (если я не забыл). Конечно, стоит прочитать, но я бы не рекомендовал начинать с этого.
Scortchi - Восстановить Монику

6

Абельсон (1995), « Статистика как принципиальный аргумент», является вводным и имеет интересный взгляд на некоторые вопросы, которые часто путают учащихся.

Но, возможно, вам просто нужно прочитать некоторые книги по теоретической статистике (пропуская все материалы о сходимости, метрических пространствах и т. Д.), И тогда, даже если они не отвечают конкретно на вопросы, такие как ваши примеры, вы сможете ответить на большинство сами, и посмотрите остальные, как предлагает @Dikran.

Я предложил в другой ветке прочитать «Кокс и Хинкли», « Теоретическая статистика» или «Кокс», « Принципы статистического вывода» вместе с «Казеллой и Бергером», « Статистический вывод», чтобы получить представление о различных перспективах.


1
Мне это показалось интересным, но я не думаю, что это на уровне, ожидаемом ОП вообще.
Гала

@ Gael Вы, вероятно, правы, особенно с учетом правки.
Scortchi - Восстановить Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.