Можете ли вы сказать, что статистика и вероятность подобны индукции и дедукции?


17

Я прочитал эту ветку , и мне кажется, что можно сказать, что:

  • статистика = индукция?
  • вероятность = вычет?

Но мне интересно, могут ли быть еще какие-то подробности по сравнению, которое я пропускаю. Например, статистика равна индукции, или это только частный случай? Кажется, что вероятность - это частный случай дедукции (поскольку это частный случай математического мышления).

Я знаю, что это очень требовательный вопрос, но в некотором смысле именно поэтому я его и задаю - потому что я хочу быть уверенным, как эти термины могут быть точно сопоставлены.


Не потому, что он отвечает на ваш вопрос, а потому, что они связаны: stats.stackexchange.com/questions/665/… (мне очень нравится ответ Марка / Питера) и stats.stackexchange.com/questions/2641/…
robin girard

Ответы:


15

Я думаю, что лучше всего быстро вспомнить значение индуктивного и дедуктивного мышления, прежде чем ответить на ваш вопрос.

  • Дедуктивная аргументация: «Дедуктивная аргументация - это попытка показать, что заключение обязательно следует из набора посылок. Дедуктивный аргумент действителен, если вывод обязательно следует из посылок, т. Е. Если вывод должен быть истинным при условии, что посылка истинна . Дедуктивный аргумент является обоснованным, если он действителен и его предпосылки верны. Дедуктивные аргументы являются действительными или недействительными, обоснованными или несостоятельными, но никогда не бывают ложными или истинными. " ( цитата из википедии , акцент добавлен).

  • «Индуктивное рассуждение, также известное как индуктивная или индуктивная логика, или образованное предположение в разговорном английском, является своего рода рассуждением, которое допускает возможность того, что заключение является ложным, даже если все предпосылки верны. Предпосылки индуктивного логического аргумента указывают на некоторую степень поддержки (индуктивной вероятности) для заключения, но не влекут его, то есть они не гарантируют его истинность. "( из Википедии , выделение добавлено)

Подчеркнем главное различие: в то время как дедуктивное рассуждение переносит истину из посылок в выводы, индуктивное рассуждение - нет. То есть, в то время как для дедуктивного мышления вы никогда не расширяете свои знания (т. Е. Все находится в помещении, но иногда скрыто и должно быть продемонстрировано с помощью доказательств), индуктивное мышление позволяет вам расширить свои знания (то есть вы можете получить новое понимание, которое однако не содержатся в помещениях за счет незнания их правды).

Как это связано с вероятностью и статистикой?

На мой взгляд, вероятность обязательно дедуктивна. Это ветвь математики. Таким образом, основываясь на некоторых аксиомах или идеях (предположительно истинных), он выводит теории.

Однако статистика не обязательно является индуктивной. Только если вы попытаетесь использовать его для получения знаний о ненаблюдаемых сущностях (т. Е. Для получения логических выводов, см. Также ответ «один стоп»). Тем не менее, если вы используете статистику для описания выборки (то есть, статистическую статистику) или если вы выбрали выборку для всей совокупности, она все еще является дедуктивной, поскольку вы не получаете больше знаний или информации, которые уже присутствуют в выборке.

Итак, если вы думаете о статистике как о героическом усилии ученых, пытающихся использовать математические методы, чтобы найти закономерности, которые управляют взаимодействием эмпирических сущностей в мире, что на самом деле никогда не бывает успешным (то есть мы никогда не узнаем, если таковые имеются из наших теорий верно), то да, это индукция. Это также Научный метод, сформулированный Фрэнсисом Бэконом, на котором основана современная эмпирическая наука. Метод приводит к индуктивным выводам, которые в лучшем случае весьма вероятны, хотя и не точны. Это, в свою очередь, приводит к недопониманию среди не ученых о значении научной теории и научных доказательств.


Обновление: после прочтения ответа Conjugate Prior (и после некоторого ночного размышления) я хотел бы кое-что добавить. Я думаю, что вопрос о том, является ли (логическое) статистическое рассуждение дедуктивным или индуктивным, зависит от того, что именно вас интересует, то есть к какому выводу вы стремитесь.

Если вас интересуют вероятностные выводы, то статистические рассуждения являются дедуктивными. Это означает, что если вы хотите знать, если, например, в 95 из 100 случаев значение популяции находится в определенном интервале (то есть, доверительном интервале), то вы можете получить истинное значение (истинное или не истинное) для этого утверждения. Вы можете сказать (если предположения верны), что в 95 из 100 случаев значение популяции находится в пределах интервала. Тем не менее, ни в одном эмпирическом случае вы не узнаете, соответствует ли численность населения полученному вами КИ. Либо так, либо нет, но нет уверенности. То же самое относится и к вероятностям в классическом p-значении и байесовской статистике. Вы можете быть уверены в вероятностях.

Однако, если вас интересуют выводы об эмпирических сущностях (например, где значение численности населения), вы можете утверждать только индуктивно. Вы можете использовать все доступные статистические методы, чтобы накапливать доказательства, которые поддерживают определенные предположения об эмпирических сущностях или причинных механизмах, с которыми они взаимодействуют. Но вы никогда не будете уверены в любом из этих предложений.

Напомним: я хочу подчеркнуть, что важно то, что вы ищете. Вероятности вы можете вывести, но для каждого определенного предложения о вещах вы можете найти только доказательства в пользу. Не больше. Смотрите также ссылку onetop на проблему индукции.


Спасибо, Хенрик, различие между определениями (и вашими мыслями о них) было полезным.
Тал Галили

Ваше обновление было ясно и точно. Если бы я мог дать вам еще один (+1), я бы.
Тал Галили

7

Статистика - это дедуктивный подход к индукции. Рассмотрим два основных подхода к статистическому выводу: частый и байесовский.

Предположим, что вы Frequentist (в стиле Fisher, а не Neyman для удобства). Вы задаетесь вопросом, принимает ли параметр существенный интерес определенное значение, поэтому вы строите модель, выбираете статистику, относящуюся к параметру, и выполняете тест. Значение p, сгенерированное вашим тестом, указывает на вероятность увидеть статистику как более или более экстремальную, чем статистика, рассчитанная по вашей выборке, при условии, что ваша модель верна. Вы получаете достаточно маленькое p-значение, поэтому вы отвергаете гипотезу о том, что параметр принимает это значение. Ваше рассуждение является дедуктивным: если предположить, что модель верна, либо параметр действительно принимает значение существенного интереса, но ваш выбор маловероятен, либо он фактически не принимает это значение.

Переход от проверки гипотезы к доверительным интервалам: у вас есть 95% доверительный интервал для вашего параметра, который не содержит значения, представляющего существенный интерес. Ваши рассуждения снова являются дедуктивными: если предположить, что модель верна, то это либо один из тех редких интервалов, которые появятся 1 к 20 разам, когда параметр действительно имеет значение по существу (поскольку ваша выборка маловероятна), либо Параметр на самом деле не имеет этого значения.

Теперь предположим, что вы байесовский (в стиле Лапласа, а не Гельмана). Предположения и расчеты вашей модели дают вам (апостериорное) распределение вероятностей по значению параметра. Большая часть массы этого распределения далека от значения основного интереса, поэтому вы пришли к выводу, что параметр, вероятно, не имеет этого значения. Ваши рассуждения опять-таки дедуктивны: если предположить, что ваша модель верна, и если предыдущее распределение представляло ваши убеждения о параметре, то ваши убеждения по этому поводу в свете данных описываются вашим последним распределением, которое очень мало вероятности для этого значения. Поскольку этот дистрибутив мало поддерживает значение существенного интереса, вы можете заключить, что параметр фактически не имеет значения. (Или, возможно, вы согласны заявить о вероятности этого).

Во всех трех случаях вы получаете логическую дизъюнкцию для обоснования своего действия, которая выводится дедуктивно / математически из предположений. Эти предположения, как правило, касаются модели того, как генерируются данные, но также могут представлять собой предварительные представления о других количествах.


1
Спасибо, Cp, вы делаете интересное замечание. Хотя, с точки зрения ответа Хенрика выше, вы все еще находитесь в области индуктивности, поскольку описываемые вами статистические рассуждения связаны с неопределенностью.
Тал Галили

Пожалуйста, ознакомьтесь с (надеюсь понятным) обновлением моего ответа, где я пытаюсь решить проблему, поднятую здесь.
Хенрик

@Henrik Это понятнее (по крайней мере, мне). Немного потихоньку: это не совсем тот случай, когда «те же рассуждения применимы к вероятностям в классическом p-значении и байесовской статистике». Последний будет давать вам одиночные вероятности событий, например , вероятность того, что истинное среднее значение между некоторым значением и другим значением (хотя другие ваши оговорки применяются все) в то время как «классические» частотные методы , такие как доверительные интервалы не будут даже делать это, несмотря на то, любящая и распространенная надежда, что они делают. Их интерпретация действительно такая, как вы ее описали.
сопряженный

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.