Как НЕ использовать статистику


15

Это своего рода открытый вопрос, но я хочу быть ясным. При достаточной численности населения вы могли бы чему-то научиться (это открытая часть), но что бы вы ни узнали о своем населении, когда это когда-либо применимо к члену населения?

Из того, что я понимаю в статистике, это никогда не применимо к одному члену населения, однако часто я нахожу себя в дискуссии, где другой человек говорит: «Я читал, что у 10% населения мира есть это заболевание» и продолжаю сделать вывод, что каждый десятый человек в комнате имеет эту болезнь.

Я понимаю, что десять человек в этой комнате - недостаточно большая выборка, чтобы статистика соответствовала действительности, но, видимо, многие из них - нет.

Тогда есть вещь о достаточно больших выборках. Вам нужно только исследовать достаточно большое население, чтобы получить достоверную статистику. Это, правда, не пропорционально сложности статистики? Если я измеряю что-то очень редкое, не значит ли это, что мне нужна гораздо большая выборка, чтобы определить релевантность такой статистики?

Дело в том, что я действительно подвергаю сомнению действительность любой газеты или статьи, когда статистика задействована, так, как она используется для укрепления доверия.

Это немного фона.

Вернемся к вопросу, каким образом вы НЕ можете или НЕ можете использовать статистику для формирования аргумента . Я отрицал вопрос, потому что я хотел бы узнать больше о распространенных заблуждениях относительно статистики.


2
Это только очень частичный ответ, поэтому я не буду публиковать его как ответ. Вы правы в том, что сложная статистика требует большего количества населения; Вы имеете в виду понятие «степеней свободы», которое представляет собой просто число независимых переменных минус один. Кроме того, когда вы выполняете что-то вроде p-теста, ваш порог отклонения зависит от количества степеней свободы в дополнение к выбранному вами p-значению (обычно 0,05).

2
Если больше людей прочитают « Как отличить лжецов от статистиков» Гука , возможно, не будет так много «статистических лохов», как сейчас в мире.
JM не статистика

1
Я думаю, что вам может быть полезно задать этот вопрос на stats stackexchange - я пометил вопрос, так что, возможно, он будет перенесен туда.
IntedestGuest

Я даже не знал, что у нас был форум, посвященный статистическому анализу. Я бы

Ответы:


2

Чтобы сделать выводы о группе, основанной на населении, группа должна быть представительной для населения и независимой. Другие обсуждали это, поэтому я не буду останавливаться на этом материале.

Еще одна вещь, которую следует учитывать, - неинтуитивность вероятностей. Давайте предположим, что у нас есть группа из 10 человек, которые являются независимыми и репрезентативными для населения (случайная выборка), и что мы знаем, что в популяции 10% имеют определенную характеристику. Поэтому у каждого из 10 человек есть 10% -ный шанс иметь характеристику. Распространенным предположением является то, что достаточно точно, что по крайней мере 1 будет иметь характеристику. Но это простая биноминальная проблема, мы можем вычислить вероятность того, что ни один из 10 не обладает характеристикой, она составляет около 35% (сходится к 1 / е для большей группы / меньшей вероятности), что намного выше, чем может предположить большинство людей. Существует также 26% вероятность того, что 2 или более человек имеют эту характеристику.


9

Если люди в комнате не являются случайной выборкой населения мира, любые выводы, основанные на статистических данных о населении мира, будут весьма подозрительными. Каждый пятый человек в мире - китаец, но никто из моих пятерых детей не ...


6
  1. Чтобы обратиться к перерасходу статистики к маленьким выборкам, я рекомендую противостоять известным шуткам («Я так взволнован, моя мама снова беременна, и мой брат и сестра будут китайцами». «Почему?» «Я читал, что каждый четвертый ребенок это китайский. ").

  2. На самом деле, я рекомендую шутки, чтобы устранить всевозможные заблуждения в статистике, см. Http://xkcd.com/552/ для корреляции и причинно-следственной связи.

  3. Проблема с газетными статьями редко заключается в том, что они относятся к редкому явлению.

  4. Парадокс Симпсонов приходит на ум в качестве примера, что статистика редко может использоваться без анализа причин.


2
Разновидность шутки «Китайский ребенок», которую я слышал, заключалась в том, что будущая мать боялась, что ее ребенок может считаться незаконным иностранцем и, следовательно, депортируется ...
JM не является статистиком

3

Есть интересная статья Мэри Грей о злоупотреблении статистикой в ​​судебных делах и тому подобное ...

Грей, Мэри У .; Статистика и Закон. Математика Магнето 56 (1983), № 2, 67–81



1

Статистический анализ или статистические данные?

Я думаю, что этот пример в вашем вопросе относится к статистическим данным: «Я читал, что 10% населения мира имеют эту болезнь». Другими словами, в этом примере кто-то использует цифры, чтобы помочь передать количество более эффективно, чем просто сказать «много людей».

Я думаю, что ответ на ваш вопрос скрыт в мотивации оратора, почему она использует цифры. Это может быть для того, чтобы лучше передать какое-то понятие, или для демонстрации авторитета, или для ослепления слушателя. Хорошая вещь о том, чтобы указывать числа вместо того, чтобы говорить «очень большие», состоит в том, что люди могут опровергать число. Посмотрите идею Поппера об опровержении.



0

Из того, что я понимаю, статистика никогда не применима ни к одному члену населения.

Неправда. Это зависит от приложения.

Пример: ядерный распад в физике. Скорость распада, определяет вероятность распада каждого ядра . Вы берете любое ядро, и оно будет иметь точно такую ​​же вероятность распада, которую вы установили экспериментальным путем на образце.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.