Все модели бесполезны? Возможна ли какая-то точная модель

45

Этот вопрос был в моей голове более месяца. Выпуск Amstat News за февраль 2015 года содержит статью профессора Беркли Марка ван дер Лаана, которая ругает людей за использование неточных моделей. Он утверждает, что при использовании моделей статистика становится искусством, а не наукой. По его словам, всегда можно использовать «точную модель», и что наша неспособность сделать это способствует «отсутствию строгости ... Я боюсь, что наше представление в науке о данных становится маргинальным».

Я согласен с тем, что мы рискуем оказаться маргинализованными, но угроза обычно исходит от тех, кто заявляет (кажется, очень похоже на профессора ван дер Лаана), что они не используют какой-то приблизительный метод, но методы которого на самом деле гораздо меньше Строгие, чем тщательно применяемые статистические модели - даже неправильные.

Я думаю, что было бы справедливо сказать, что профессор ван дер Лаан довольно презрительно относится к тем, кто повторяет часто используемую цитату Бокса: «Все модели ошибочны, но некоторые полезны». По сути, когда я это читаю, он говорит, что все модели ошибочны и бесполезны. Теперь, кто я такой, чтобы не соглашаться с профессором Беркли? С другой стороны, кто он такой, чтобы столь кавалерно отвергать взгляды одного из настоящих гигантов в нашей области?

В своем развитии д-р ван дер Лаан утверждает, что «совершенно бессмысленно утверждать, что все модели ошибочны ... Например, статистическая модель, которая не делает никаких предположений, всегда верна». Он продолжает: «Но часто мы можем добиться гораздо большего: мы можем знать, что данные являются результатом независимых идентичных экспериментов». Я не понимаю, как это можно узнать, кроме как в очень узкой случайной выборке или в контролируемых экспериментальных условиях. Автор указывает на свою работу по целевому обучению с максимальным правдоподобием и целевому обучению с минимальными потерями, которое «объединяет современный уровень техники в машинном обучении / адаптивную оценку данных, все невероятные достижения в области причинно-следственных связей, цензурированных данных, эффективности и эмпирических результатов». теория процесса, в то же время обеспечивая формальный статистический вывод ". $n$

Есть также некоторые утверждения, с которыми я согласен. Он говорит, что мы должны серьезно относиться к нашей работе, нашей роли статистика и наших научных сотрудников. Слышу, слышу! Это, конечно, плохая новость, когда люди обычно используют модель логистической регрессии, или что-то еще, без тщательного рассмотрения, является ли она адекватной для ответа на научный вопрос или соответствует ли она данным. И я вижу много таких злоупотреблений в вопросах, размещенных на этом форуме. Но я также вижу эффективное и ценное использование неточных моделей, даже параметрических. И вопреки тому, что он говорит, мне редко «до смерти надоела другая модель логистической регрессии». Такова моя наивность, наверное.

Итак, вот мои вопросы:

Какие полезные статистические выводы можно сделать, используя модель, которая вообще не делает никаких предположений?
Существует ли тематическое исследование с важными реальными данными по использованию целевого максимального правдоподобия? Эти методы широко используются и приняты?
Все ли неточные модели действительно бесполезны?
Можно ли узнать, что у вас есть точная модель, кроме как в тривиальных случаях?
Если это слишком основано на мнении и, следовательно, не по теме, где это можно обсудить? Потому что статья доктора ван дер Лаана определенно нуждается в некотором обсуждении.

— RVL
источник

13

Я бы сказал, что модель без допущений почти всегда бесполезна, но Ван дер Лаан, безусловно, делает допущения, не признавая этого. На самом деле мы не знаем многих вещей наверняка, поэтому его «Мы можем знать, что данные являются результатом n независимых идентичных экспериментов», на самом деле является предположением , или, по крайней мере, частично так. Возможно, у нас есть веские основания полагать, что они идентичны и независимы, но на практике мы видим, что очень часто оказывается, что это не совсем так (и если мы обнаруживаем, что иногда это нужно иногда обнаруживать, предположительно, гораздо чаще) ).

— Glen_b

19

Модель без допущений - это просто репликация вашей матрицы данных. Это правда, но также бесполезное дублирование усилий. Можно также утверждать, что такая модель не является моделью: одно из определений модели - это упрощение реальности. Таким образом, модель, которая не упрощает, по определению не является моделью. Это упрощение имеет цель: оно помогает нам по существу понять, что происходит; это дает нам основную историю. Если вам не важно понимать, почему что-то происходит, и вы хотите только предсказать, эта основная история неуместна. Тем не менее, некоторые хотят сделать больше, чем создать хрустальный шар ...

— Мартен Буис

8

Модель без допущений не является моделью. Модель представляет собой набор предположений. Кроме того, как говорит @Glen_b, предположение iid довольно сильное, и я не могу придумать пример, где оно «верно». Даже при многократном подбрасывании монеты существуют корреляции (см. Работу Диакониса). Я только просмотрел статью, но она кажется недальновидной.

— П.Уиндридж

11

Первый пример автора о полете на Марс - фальшивка. Ньютоновская механика (на которую опираются многие аспекты космических миссий) - неправильная модель, но мы полагаемся на нее, и она полезна.

— П.Уиндридж

6

Да, ньютоновская механика - отличный пример идеи Джорджа Бокса.

— Glen_b

15

Цитируемая статья, кажется, основана на опасениях, что статистики "не будут неотъемлемой частью научной команды, и у ученых, естественно, возникнут сомнения относительно использованных методов", и что "соавторы будут рассматривать нас как техников, которых они могут направить, чтобы получить их научные результаты опубликованы ". Мои комментарии по вопросам, заданным @rvl, исходят от точки зрения ученого-биолога, не являющегося статистиком, который был вынужден решать все более сложные статистические вопросы, поскольку в последние несколько лет я перешел от стендовых исследований к трансляционным / клиническим исследованиям. На вопрос 5 четко ответили многочисленные ответы, которые теперь есть на этой странице; Я пойду в обратном порядке оттуда.

4) На самом деле не имеет значения, существует ли «точная модель», потому что даже если это произойдет, я, вероятно, не смогу позволить себе провести исследование. Рассмотрим эту проблему в контексте обсуждения: действительно ли нам нужно включать «все соответствующие предикторы»? Даже если мы сможем определить «все соответствующие предикторы», все равно будет проблема сбора достаточного количества данных, чтобы обеспечить степень свободы для включения все они надежно входят в модель. Это достаточно сложно в контролируемых экспериментальных исследованиях, не говоря уже о ретроспективных или популяционных исследованиях. Может быть, в некоторых типах «больших данных» это меньше проблем, но это для меня и моих коллег. Всегда будет необходимость «быть умным» по этому поводу, как @Aksakal написал ответ на этой странице.

Справедливости ради профессора ван дер Лаана он не использует слово «точный» в цитируемой статье, по крайней мере, в версии, доступной в настоящее время по ссылке . Он говорит о «реалистичных» моделях. Это важное различие.

С другой стороны, профессор ван дер Лаан жалуется, что «статистика теперь является искусством, а не наукой», что более чем несправедливо с его стороны. Рассмотрим, как он предлагает работать с соавторами:

... мы должны серьезно относиться к данным, нашей личности статистика и нашим научным сотрудникам. Нам нужно узнать как можно больше о том, как были сгенерированы данные. После того, как мы представили реалистичную статистическую модель, нам нужно извлечь из наших сотрудников то, что оценка лучше всего представляет ответ на их интересующий научный вопрос. Это много работы. Это трудно. Это требует разумного понимания статистической теории. Это достойное академическое предприятие!

Применение этих научных принципов к реальным проблемам, по-видимому, потребовало бы большого «искусства», как и в работе на любом научном предприятии. Я знал некоторых очень успешных ученых, еще много, кто сделал хорошо, и некоторые неудачи. По моему опыту, разница, похоже, заключается в «искусстве» достижения научных целей. Результатом может стать наука, но процесс - нечто большее.

3) Опять же, часть вопроса является терминологической; Существует большая разница между «точной» моделью и «реалистичными» моделями, к которым стремится профессор ван дер Лаан. Он утверждает, что многие стандартные статистические модели достаточно нереалистичны для получения «ненадежных» результатов. В частности: «Оценки оценки, определенной в честной статистической модели, не могут быть разумно оценены на основе параметрических моделей». Это вопросы для тестирования, а не мнения.

Его собственная работа ясно признает, что точные модели не всегда возможны. Рассмотрим эту рукопись о целевых оценках максимального правдоподобия (TMLE) в контексте отсутствующих переменных результата. Он основан на предположении о том, что результаты отсутствуют случайным образом, что никогда не может быть проверено на практике: «... мы предполагаем, что не существует ненаблюдаемых факторов, определяющих связь между отсутствием ... и результатом». Это еще один пример сложности включения «всех соответствующих предикторов». Сила TMLE, однако, заключается в том, что он, похоже, помогает оценить «допущение положительности» адекватной поддержки в данных для оценки целевого параметра в этом контексте. Цель состоит в том, чтобы максимально приблизиться к реалистичной модели данных.

2) TMLE уже обсуждался на Cross Validated ранее. Я не знаю о широком распространении реальных данных. Google Scholar показал сегодня 258 ссылок на то, что кажется первоначальным отчетом , но, на первый взгляд, ни один из них не показался для больших наборов данных реального мира. В статье « Журнал статистического программного обеспечения», относящейся к пакету R, показаны только 27 ссылок Google Scholar на сегодняшний день. Однако это не должно восприниматься как доказательство ценности TMLE. Его ориентация на получение надежных непредвзятых оценок фактической «оценки», представляющей интерес, часто представляет собой проблему с оценками подключаемых модулей, полученными из стандартных статистических моделей, представляется потенциально ценной.

1) Утверждение: «Статистическая модель, которая не делает никаких предположений, всегда верна», похоже, предназначена для соломенного человека, тавтологии. Данные являются данными. Я предполагаю, что существуют законы вселенной, которые остаются неизменными изо дня в день. Предполагается, что метод TMLE содержит предположения о выпуклости в пространстве поиска, и, как отмечалось выше, его применение в конкретном контексте может потребовать дополнительных предположений.

Даже проф. Ван дер Лаан согласится, что некоторые предположения необходимы. Я чувствую, что он хотел бы свести к минимуму количество предположений и избежать тех, которые являются нереальными. Требует ли это действительно отказа от параметрических моделей, как он, кажется, утверждает, является решающим вопросом.

— магистр педагогических наук
источник

Очень хороший ответ. Книга Targeted Learning - хорошее место, чтобы узнать больше. В дополнение к теории он содержит некоторые тематические исследования.

— NRH

12

Может быть, я упустил момент, но я думаю, что вы должны немного отступить.

Я думаю, что его цель - злоупотребление легкодоступными инструментами без каких-либо дополнительных знаний. Это также верно для простого t-теста: просто напишите алгоритм с вашими данными, получив p <0,05 и подумав, что ваш тезис верен. Совершенно неправильно. Вы, конечно, должны знать больше о ваших данных.

Отступив еще дальше: нет ничего похожего на точную модель ( физик здесь). Но некоторые очень хорошо согласуются с нашими измерениями. Единственная точная вещь - математика. Что не имеет ничего общего с реальностью или ее моделями . Все остальное (и каждая модель реальности) является «неправильным» (как часто цитируется).

Но что значит «неправильно» и полезно? Судите сами:

ВСЕ наши современные технологии (компьютеры, ракеты, радиоактивность и т. Д.) Основаны на этих неправильных моделях. Может быть, даже вычислено с помощью «неправильных» симуляций с «неправильными» моделями.
-> Фокус больше на «полезном», а не «неправильном»;)

Более подробно на ваши вопросы:

Не знаю, прости!
Да. Один пример: в физике элементарных частиц вы хотите обнаружить определенные частицы (например, электроны, протоны и т. Д.). Каждая частица оставляет характерный след в детекторе (и, следовательно, в данных), но изменяется даже для одной и той же частицы (по своей природе). Сегодня большинство людей используют машинное обучение для достижения этой цели (это было огромным упрощением, но в значительной степени похоже на это), и наблюдается увеличение эффективности на 20% -50% по сравнению с выполнением вручную статистики .
Никто действительно не утверждал это! Не делайте неправильный вывод! (a: все модели неточны, а b: некоторые полезны. Не путайте вещи)
Точной модели не существует ( за исключением математики, но на самом деле не в статистике, поскольку наличие точек точно на прямой и «подгонка» прямой через нее может быть точным ... но это неинтересный особый случай, который никогда не происходит) ,
Не знаю :) Но ИМХО я вижу это скорее как «просто потому, что это может использовать каждый ребенок, а не каждый» и не злоупотребляйте им вслепую.

— Mayou36
источник

Я рассмотрю ваши замечания, но по пунктам (3) и (4) я предлагаю вам взглянуть на статью ван дер Лаана, а также на мой вопрос, потому что в статье довольно ясно сказано, что он не использует неточные модели, и неоднократно ссылается на «точную модель». Так что да, я бы сказал, что кто-то действительно так сказал. Я в значительной степени согласен с тем, что вы говорите о моделях, а также с механическим применением методов; и поэтому я не думаю, что ты хочешь, чтобы я сделал шаг назад.

— rvl

Да для всех. И главным образом, я хотел, чтобы он сделал шаг назад;) Я думаю, что я не упомянул, чтобы построить теоретические (математические) модели, вам, конечно, нужны «точные» модели. Таким образом, чтобы «изобрести» лучшие модели и статистические инструменты, вам нужны детерминированные (или точные) модели в качестве основы. Я думаю, что даже целевое обучение тестом не должно быть «неточным» в этом смысле.

— Mayou36

6

В экономике много говорится о понимании «процесса генерации данных». Я не уверен, что именно подразумевается под «точной» моделью, но в экономическом плане она может быть такой же, как «правильно заданная» модель.

Конечно, вы хотите узнать как можно больше о процессе, который генерировал данные, прежде чем пытаться использовать модель, верно? Я думаю, что трудность возникает из-за того, что: а) мы можем не иметь представления о реальном DGP и б) даже если бы знали настоящий DGP, его было бы трудно моделировать и оценивать (по многим причинам).

Таким образом, вы делаете предположения, чтобы упростить вопросы и уменьшить требования к оценке. Можете ли вы когда-нибудь узнать, верны ли ваши предположения? Вы можете получить доказательства в их пользу, но в некоторых случаях трудно быть уверенным в этом.

Я должен фильтровать все это с точки зрения как устоявшейся теории, так и практичности. Если вы делаете допущение, согласующееся с теорией, и это предположение дает вам лучшую оценку производительности (эффективность, точность, согласованность и т. Д.), То я не вижу причин избегать ее, даже если она делает модель «неточной».

Честно говоря, я думаю, что эта статья призвана побудить тех, кто работает с данными, усерднее думать о всем процессе моделирования. Понятно, что ван дер Лаан делает предположения в своей работе . В этом примере , на самом деле, ван дер Лаан, кажется, отбрасывает любую озабоченность по поводу точной модели и вместо этого использует массу процедур, чтобы максимизировать производительность. Это делает меня более уверенным в том, что он поднял цитату Бокса с целью помешать людям использовать ее как выход из сложной работы по пониманию проблемы.

Посмотрим правде в глаза, мир изобилует злоупотребления и злоупотребления статистическими моделями. Люди слепо применяют все, что они умеют делать, и, что еще хуже, другие часто интерпретируют результаты наиболее желательным образом. Эта статья является хорошим напоминанием о необходимости быть осторожным, но я не думаю, что мы должны доводить ее до крайности.

Последствия вышесказанного для ваших вопросов:

Я согласен с другими в этом посте, которые определили модель как набор предположений. При таком определении модель без допущений на самом деле не является моделью. Даже предварительный анализ данных (т.е. без модели) требует предположений. Например, большинство людей считают, что данные измерены правильно.
Я не знаю о TMLE, как таковой, но в экономике есть много статей, в которых используется та же основная философия вывода о причинно-следственном воздействии на ненаблюдаемую контрфактуальную выборку. Однако в этих случаях получение лечения не зависит от других переменных в модели (в отличие от TMLE), и поэтому экономисты широко используют моделирование. Существует несколько тематических исследований для структурных моделей, таких как этот, где авторы убедили компанию внедрить свою модель и нашли хорошие результаты.
Я думаю, что все модели неточны, но, опять же, этот термин немного нечеткий. ИМО, это в основе цитаты Бокса. Я перескажу свое понимание Box следующим образом: «ни одна модель не может уловить точную сущность реальности, но некоторые модели действительно отражают переменную интереса, поэтому в этом смысле вы могли бы использовать их».
Я обратился к этому выше. Короче, я так не думаю.
Я не уверен. Мне нравится это прямо здесь.

— Джейсон
источник

5

Что касается пункта 3, ответ, очевидно, нет. Практически каждое человеческое предприятие в какой-то момент основано на упрощенной модели: приготовление пищи, построение, межличностные отношения - все это вовлекает людей, действующих на основе определенных данных и предположений. Никто никогда не создавал модель, которую они не собирались использовать. Утверждать иначе - пустая педантичность.

Гораздо более интересным и полезным, и полезно спросить , когда неточные модели не полезны, почему они не в их полезности, и что происходит , когда мы полагаемся на моделях , которые оказываются не быть полезным. Любой исследователь, будь то в научных или промышленных кругах, должен задавать этот вопрос проницательно и часто.

Я не думаю, что на этот вопрос можно ответить вообще, но принципы распространения ошибок будут отвечать ответу. Неточные модели разрушаются, когда предсказываемое ими поведение не отражает поведение в реальном мире. Понимание того, как ошибки распространяются через систему, может помочь понять, насколько необходима точность при моделировании системы.

Например, жесткая сфера обычно не плохая модель для бейсбола. Но когда вы создаете перчатку для ловли, эта модель подведет вас и приведет к неправильному дизайну. Ваши упрощающие предположения о физике бейсбола распространяются через вашу систему бейсбольных перчаток и приводят вас к неправильным выводам.

— shadowtalker
источник

5

1) Какие полезные статистические выводы можно сделать, используя модель, которая вообще не делает никаких предположений?

Модель по определению является обобщением того, что вы наблюдаете, которое может быть охвачено определенными причинными факторами, которые, в свою очередь, могут объяснить и оценить событие, которое вы наблюдаете. Учитывая, что все эти алгоритмы обобщения имеют какие-то базовые предположения. Я не уверен, что осталось от модели, если у вас нет никаких предположений. Я думаю, что вы остались с исходными данными и без модели.

2) Существует ли тематическое исследование с важными реальными данными по использованию целевого максимального правдоподобия? Эти методы широко используются и приняты?

Я не знаю. Максимальная вероятность используется все время. Модели Logit основаны на этих и многих других моделях. Они не сильно отличаются от стандартных OLS, где вы сосредотачиваетесь на уменьшении суммы квадратов невязок. Я не уверен, на что рассчитана максимальная вероятность. И чем оно отличается от традиционного максимального правдоподобия.

3) Все ли неточные модели действительно бесполезны?

Точно нет. Неточные модели могут быть очень полезны. Во-первых, они способствуют лучшему пониманию или объяснению явления. Это должно что-то значить. Во-вторых, они могут предоставить оценку спуска и прогнозирование с соответствующим доверительным интервалом, чтобы зафиксировать неопределенность, связанную с оценкой. Это может дать много информации о том, что вы изучаете.

Проблема «неточности» также поднимает проблему напряженности между скупостью и переодеванием. Вы можете иметь простую модель с 5 переменными, которая является «неточной», но довольно неплохо выполняет захват и объяснение общего тренда зависимой переменной. У вас может быть более сложная модель с 10 переменными, которая «более точна», чем первая (более высокая скорректированная R-квадрат, более низкая стандартная ошибка и т. Д.). Тем не менее, эта вторая более сложная модель может действительно потерпеть крах, когда вы протестируете ее с использованием образца Hold Out. И, в таком случае, возможно, «неточная» модель на самом деле работает намного лучше в образце Hold Out. Это происходит буквально все время в эконометрике, и я подозреваю, что во многих других социальных науках. Остерегайтесь «точных» моделей.

4) Можно ли узнать, что у вас есть точная модель, кроме как в тривиальных случаях?

Невозможно узнать, что у вас есть точная модель. Но можно знать, что у вас довольно хорошая модель. Меры критериев информации (AIC, BIC, SIC) могут дать вам много информации, позволяющей сравнивать и оценивать относительную производительность различных моделей. Кроме того, тест LINK также может помочь в этом отношении.

5) Если это слишком основано на мнении и, следовательно, не по теме, где это может обсуждаться? Потому что статья доктора ван дер Лаана определенно нуждается в некотором обсуждении.

Я думаю, что это такой же подходящий форум для обсуждения этого вопроса, как и везде. Это довольно интересный вопрос для большинства из нас.

— Sympa
источник

5

(Я не вижу фразу "точная модель" в статье (хотя цитируется выше))

1) Какие полезные статистические выводы можно сделать, используя модель, которая вообще не делает никаких предположений?

Вы должны начать где-нибудь. Если это все, что у вас есть (ничего), это может быть отправной точкой.

2) Существует ли тематическое исследование с важными реальными данными по использованию целевого максимального правдоподобия? Эти методы широко используются и приняты?

Чтобы ответить на второй вопрос, в 93/1143281 (~ .008%) статей на arxiv.org появляется Targeted Maximum правдоподобие. Таким образом, нет , вероятно, хорошая оценка (без предположений) для этого.

3) Все ли неточные модели действительно бесполезны?

Нет. Иногда вы заботитесь только об одном аспекте модели. Этот аспект может быть очень хорошим, а остальное очень неточным.

4) Можно ли узнать, что у вас есть точная модель, кроме как в тривиальных случаях?

Лучшая модель модель , которая лучше всего отвечает на ваш вопрос. Это может означать что-то не учитывать То, что вы хотите избежать, как вы можете, является нарушение предположения.

5) Счастливый час . И напитки дешевле, чтобы загрузить!

Я нахожу использование слова «точный» немного тревожным. Это не очень похожий на статистику разговор. Неточность? Вариация? Слава Богу! Вот почему мы все здесь. Я думаю, что фраза «Все модели неправильны ...» это хорошо, но только в правильной компании. Статистики понимают, что это значит, но мало кто знает.

— mandata
источник

Хороший момент по поводу фразы «точная модель». Он говорит вещи об «истинных» и «реальных» моделях, которые эквивалентны, особенно учитывая контекст и тон статьи, но вы правы, цитата не является «точной» (каламбур).

— SQLServerSteve

Виноват. Я должен был процитировать его правильно.

— RVL

Я чувствую, что попытка достичь истинной или реальной модели упускает смысл упражнения. Я думаю, что он действительно пытается обсудить плохие модели.

— Мандата

Да, в статье есть много хороших замечаний, но он вкрапляет множество крайних комментариев, таких как: «Полностью бессмысленно утверждать, что все модели ошибочны», когда на самом деле все они в какой-то степени ошибочны. Глупо говорить иначе. Он определенно ставит крайнюю позицию. Rvl был совершенно прав, чтобы поднять это и вызвать его (не парьтесь с цитатой, Рил, важно то, что вы правильно уловили смысл).

— SQLServerSteve

4

Эта статья представляется мне честной, но политической статьей, искренней полемикой . Как таковой, он содержит много страстных отрывков, которые не имеют научного смысла, но, тем не менее, могут быть полезны для разжигания полезных разговоров и дискуссий по важным вопросам.

Здесь есть много хороших ответов, поэтому позвольте мне процитировать несколько строк из статьи, чтобы показать, что профессор Лан, конечно, не использует какую-либо «точную модель» в своей работе (и, кстати, кто говорит, что «точная» модель "это понятие эквивалентно фактическому механизму генерирования данных?)

Цитаты (жирный шрифт)

«Как только мы представим реалистичную статистическую модель, нам нужно извлечь из наших сотрудников то, что оценка лучше всего представляет ответ на их интересующий их научный вопрос ».

Комментарий: «реалистичный» так же удален от «точного», как и Марс с Земли. Они оба вращаются вокруг Солнца, поэтому для некоторых целей не имеет значения, какую планету выбрать. Для других целей это имеет значение. Также «лучшим» является относительное понятие. «Точного» нет.

«Оценки оценки, определенной в честной статистической модели, не могут быть разумно оценены на основе параметрических моделей ...»

Комментарий: Честность - действительно лучшая политика, но она точно не может быть «точной». Кроме того, «разумная оценка» представляется очень размытым результатом, если использовать «точную модель».

« В ответ на необходимость решать эти сложные задачи оценки наилучшим образом , мы разработали общий статистический подход ... »

Комментарий: ОК. Мы "делаем все возможное". Как почти все думают о себе. Но «лучшее, что мы можем» - это не «точно».

— Алекос Пападопулос
источник

2

Я собираюсь подойти к этому с альтернативного направления философии в свете действительно полезных принципов управления неопределенностью, обсуждаемых в книгах Джорджа Ф. Клира о нечетких множествах. Я не могу дать ван дер Лаану точность, но могу привести несколько исчерпывающих аргументов в пользу того, почему его цель логически невозможна; это вызовет длительную дискуссию, которая затрагивает другие области, так что терпите меня.

Клир и его соавторы делят неопределенность на несколько подтипов, таких как неспецифичность (то есть, когда у вас есть неизвестный набор альтернатив, рассматриваемых с помощью таких средств, как функция Хартли); неточность в определениях (то есть "нечеткость", смоделированная и количественно определенная в нечетких множествах); раздор или раздор в доказательствах (рассматривается в теории доказательств Демпстера-Шафера); плюс теория вероятностей, теория вероятностей и неопределенность измерений, где цель состоит в том, чтобы иметь адекватную возможность для сбора соответствующих доказательств при минимизации ошибок. Я рассматриваю весь набор инструментов статистических методов как альтернативное средство разделения неопределенности по-разному, во многом как резак печенья; доверительные интервалы и значения p изолируют неопределенность одним способом, в то время как меры, подобные энтропии Шеннона, уменьшают ее с другой стороны. Что они могут Это, однако, полностью исключить. Чтобы создать «точную модель», подобную описанной Ван дер Лааном, нам нужно уменьшить все эти типы неопределенности до нуля, чтобы больше не оставалось деления. По-настоящему «точная» модель всегда будет иметь значения вероятности и вероятности 1, оценки неспецифичности 0 и никакой неопределенности в определениях терминов, диапазонов значений или шкал измерения. Там не будет разногласий в альтернативных источниках доказательств. Предсказания, сделанные такой моделью, всегда будут на 100 процентов точными; Прогностические модели по сути делят свою неопределенность на будущее, но откладывать их уже некуда. Перспектива неопределенности имеет несколько важных последствий: Вроде того, что Ван дер Лаан, кажется, описывает, нам нужно уменьшить все эти типы неопределенности до нуля, чтобы больше не оставалось деления. По-настоящему «точная» модель всегда будет иметь значения вероятности и вероятности 1, оценки неспецифичности 0 и никакой неопределенности в определениях терминов, диапазонов значений или шкал измерения. Там не будет разногласий в альтернативных источниках доказательств. Предсказания, сделанные такой моделью, всегда будут на 100 процентов точными; Прогностические модели по сути делят свою неопределенность на будущее, но откладывать их уже некуда. Перспектива неопределенности имеет несколько важных последствий: Вроде того, что Ван дер Лаан, кажется, описывает, нам нужно уменьшить все эти типы неопределенности до нуля, чтобы больше не оставалось деления. По-настоящему «точная» модель всегда будет иметь значения вероятности и вероятности 1, оценки неспецифичности 0 и никакой неопределенности в определениях терминов, диапазонов значений или шкал измерения. Там не будет разногласий в альтернативных источниках доказательств. Предсказания, сделанные такой моделью, всегда будут на 100 процентов точными; Прогностические модели по сути делят свою неопределенность на будущее, но откладывать их уже некуда. Перспектива неопределенности имеет несколько важных последствий: По-настоящему «точная» модель всегда будет иметь значения вероятности и вероятности 1, оценки неспецифичности 0 и никакой неопределенности в определениях терминов, диапазонов значений или шкал измерения. Там не будет разногласий в альтернативных источниках доказательств. Предсказания, сделанные такой моделью, всегда будут на 100 процентов точными; Прогностические модели по сути делят свою неопределенность на будущее, но откладывать их уже некуда. Перспектива неопределенности имеет несколько важных последствий: По-настоящему «точная» модель всегда будет иметь значения вероятности и вероятности 1, оценки неспецифичности 0 и никакой неопределенности в определениях терминов, диапазонов значений или шкал измерения. Там не будет разногласий в альтернативных источниках доказательств. Предсказания, сделанные такой моделью, всегда будут на 100 процентов точными; Прогностические модели по сути делят свою неопределенность на будущее, но откладывать их уже некуда. Перспектива неопределенности имеет несколько важных последствий: Предсказания, сделанные такой моделью, всегда будут на 100 процентов точными; Прогностические модели по сути делят свою неопределенность на будущее, но откладывать их уже некуда. Перспектива неопределенности имеет несколько важных последствий: Предсказания, сделанные такой моделью, всегда будут на 100 процентов точными; Прогностические модели по сути делят свою неопределенность на будущее, но откладывать их уже некуда. Перспектива неопределенности имеет несколько важных последствий:

• Этот высокий порядок не только физически неправдоподобен, но фактически логически невозможен. Очевидно, что мы не можем достичь совершенно непрерывных масштабов измерений с бесконечно малыми градусами, собирая конечные наблюдения с использованием ошибочных, физических научных средств; всегда будет некоторая неопределенность с точки зрения масштаба измерения. Точно так же всегда будет некоторая неясность вокруг самих определений, которые мы используем в наших экспериментах. Будущее также неопределенно по своей природе, поэтому предположительно совершенные предсказания наших «точных» моделей придется рассматривать как несовершенные, пока не доказано обратное - что займет вечность.

• Что еще хуже, в какой-то момент процесса ни одна из методик измерения не будет на 100 процентов свободна от ошибок, и при этом она не может быть сделана настолько всеобъемлющей, чтобы охватить всю возможную противоречивую информацию во вселенной. Кроме того, исключение возможных смешанных переменных и полная условная независимость не могут быть полностью доказаны без изучения всех других физических процессов, которые влияют на тот, который мы исследуем, а также тех, которые влияют на эти вторичные процессы и так далее.

• Точность возможна только в чистой логике и ее подмножестве, математике, именно потому, что абстракции отделены от реальных проблем, таких как эти источники неопределенности. Например, с помощью чистой дедуктивной логики мы можем доказать, что 2 + 2 = 4, и любой другой ответ на 100 процентов неверен. Мы также можем сделать совершенно точные прогнозы, что оно всегда будет равно 4. Такая точность возможна только в статистике, когда мы имеем дело с абстракциями. Статистика невероятно полезна применительно к реальному миру, но сама вещь, которая делает ее полезной, вводит, по крайней мере, некоторую степень неизбежной неопределенности, тем самым делая ее неточной. Это неизбежная дилемма.

• Кроме того, Питер Чу устанавливает дополнительные ограничения в разделе комментариев статьи, на которую ссылается rvl. Он ставит это лучше, чем я могу:

«Эта поверхность решения NP-трудных задач, как правило, изобилует многими локальными оптимумами, и в большинстве случаев вычислительно невозможно решить проблему, то есть найти глобальное оптимальное решение в целом. Следовательно, каждый разработчик моделей использует некоторые (эвристические) методы моделирования, в лучшем случае найти адекватные локальные оптимальные решения в обширном пространстве решений этой сложной целевой функции ".

• Все это означает, что сама наука не может быть абсолютно точной, хотя ван дер Лаан, кажется, так говорит об этом в своей статье; научный метод как абстрактный процесс точно определим, но невозможность универсального и совершенного точного измерения означает, что он не может создавать точные модели, лишенные неопределенности. Наука - отличный инструмент, но у него есть пределы.

• От этого становится хуже: даже если бы было возможно точно измерить все силы, действующие на каждый составляющий кварк и глюон во вселенной, некоторые неопределенности все равно остались бы. Во-первых, любые прогнозы, сделанные с помощью такой полной модели, все еще будут неопределенными из-за существования множества решений для уравнений с квинтами и старших многочленов. Во-вторых, мы не можем быть полностью уверены, что крайний скептицизм, воплощенный в классическом вопросе «может быть, это все мечта или галлюцинация», не является отражением реальности - в этом случае все наши модели действительно ошибочны в худшем из возможных проявлений. , Это в основном эквивалентно более экстремальной онтологической интерпретации оригинальных эпистемологических формулировок таких философий, как феноменализм, идеализм и солипсизм.

• В 1909 году классическое православиеГ. К. Честертон отметил, что крайние версии этих философий действительно могут быть оценены, но по тому, толкают ли они своих верующих в психиатрические учреждения; например, онтологический солипсизм, как и некоторые из его кузенов, является маркером шизофрении. Лучшее, чего мы можем достичь в этом мире, - это устранить разумные сомнения; необоснованное сомнение в этом тревожном типе не может быть строго устранено, даже в гипотетическом мире точных моделей, исчерпывающими и безошибочными измерениями. Если ван дер Лаан стремится избавить нас от необоснованных сомнений, тогда он играет с огнем. Постигая совершенство, конечное благо, которое мы можем сделать, ускользнет из наших пальцев; мы являемся конечными существами, существующими в бесконечном мире, а это означает, что тот вид полного и совершенно определенного знания, о котором утверждает ван дер Лаан, постоянно находится за пределами нашего понимания. Единственный способ достичь такого рода определенности - это отступить от этого мира в более узкие рамки совершенно абстрактного, который мы называем «чистой математикой». Это не означает, однако, что отступление к чистой математике является решением для устранения неопределенности. По сути, это был подход, принятый преемниками Людвига Витгенштейна (1889-1951), который опустошил свою философию логического позитивизма любым здравым смыслом, полностью отвергнув метафизику и полностью отступив от чистой математики и сциентизма, а также крайнего скептицизма. чрезмерная специализация и переоценка точности и полезности. В процессе они разрушили дисциплину философии, растворив ее в болоте придирки к определениям и пристальному взгляду на пупок, что сделало ее неуместной для остальной части академического сообщества. Это, по сути, убило всю дисциплину, которая до начала 20-го века все еще была в авангарде академических дебатов, до такой степени, что она по-прежнему привлекала внимание средств массовой информации, а некоторые из ее лидеров были нарицательными именами. Они ухватились за идеальное, отполированное объяснение мира, и оно ускользнуло у них из рук - так же, как и у психически больных, о которых говорил GKC. Это также выскользнет из рук ван дер Лаана, который уже опроверг свою точку зрения, о которой говорится ниже. Погоня за слишком точными моделями не просто невозможна; это может быть опасно, если доведено до самоубийственной одержимости. Погоня за такой чистотой редко заканчивается хорошо; это часто так же самоубийственно, как те гермофобы, которые так яростно вытирают руки, что в итоге получают раны, которые заразятся. Это' напоминает Икара, пытающегося украсть огонь у Солнца: как конечные существа, мы можем иметь только конечное понимание вещей. Как Честертон также говорит в Православии: «Это логик, который стремится получить небеса в его голове. И это его голова, которая раскалывается».

В свете вышесказанного позвольте мне ответить на некоторые конкретные вопросы, перечисленные в rvl:

1) Модель без каких-либо допущений либо: а) не знает своих собственных допущений, либо б) должна быть четко отделена от соображений, которые вводят неопределенность, таких как ошибки измерения, учет каждой возможной смешанной переменной, совершенно непрерывных шкал измерения и нравится.

2) Я все еще новичок, когда дело доходит до оценки максимального правдоподобия (MLE), поэтому я не могу комментировать механику вероятности цели, кроме как указать на очевидное: вероятность - это всего лишь вероятность, а не уверенность , Чтобы получить точную модель, требуется полное устранение неопределенности, что вероятностная логика может сделать редко, если вообще когда-либо.

3) Конечно нет. Поскольку все модели сохраняют некоторую неопределенность и, следовательно, неточны (за исключением случаев чистой математики, оторванных от физических измерений в реальном мире), человеческая раса не смогла бы добиться какого-либо технического прогресса на сегодняшний день - или даже любого другого прогресса в все. Если бы неточные модели всегда были бесполезны, мы бы вели этот разговор в пещере, а не об этом невероятном технологическом подвиге, называемом Интернетом, и все это стало возможным благодаря неточному моделированию.

По иронии судьбы, собственная модель Ван дер Лаана - главный пример неточности. Его собственная статья обрисовывает в общих чертах модель того, как поле статистики должно управляться, с целью к точным моделям; к этой «модели» пока не приложены цифры, нет измерения того, насколько неточно или бесполезно большинство моделей сейчас в его представлении, нет количественной оценки того, как далеко мы отошли от его видения, но я полагаю, что можно было бы разработать тесты для этих вещей. , Однако в его нынешнем виде его модель неточна. Если это не полезно, это означает, что его точка зрения неверна; если это полезно, это побеждает его главный пункт, что неточные модели бесполезны. В любом случае, он опровергает свой собственный аргумент.

4) Вероятно, нет, потому что мы не можем располагать полной информацией для тестирования нашей модели по тем же причинам, по которым мы не можем получить точную модель в первую очередь. Точная модель по определению потребует совершенной предсказуемости, но даже если первые 100 тестов окажутся на 100 процентов точными, 101-й может и не быть. Тогда есть весь вопрос бесконечно малых шкал измерения. После этого мы попадаем во все другие источники неопределенности, которые могут испортить любую оценку Башни Слоновой Кости нашей модели Башни Слоновой Кости.

5) Чтобы решить эту проблему, мне пришлось поставить ее в более широкий контекст гораздо более крупных философских вопросов, которые часто противоречивы, поэтому я не думаю, что это возможно обсудить без учета мнений (обратите внимание, что это само по себе является другим источник неуверенности) но вы правы, эта статья заслуживает ответа. Многое из того, что он говорит по другим темам, находится на правильном пути, например, необходимость сделать статистику релевантной для больших данных, но там есть некоторый непрактичный экстремизм, который нужно исправить, и это нужно исправить.

— SQLServerSteve
источник

1

Кто эти "преемники Витгенштейна", которые "разрушили дисциплину философии" !? Тенденция послевоенной аналитической философии - подумайте о поздних Витгенштейне, Остине, Куине, Кенни, Гудмане, Льюисе, Дэвидсоне, Рорти - кажется, отвергает принципы логического позитивизма, реабилитации метафизики и отступления от сциентизма. (Комментарии Рорти к Ницше и Лойоле предполагают, что он, возможно, согласился с мнением Честертона.) Что касается того, почему Ким Кардашьян нарицательное имя, а не Саул Крипке, я подозреваю, что с начала 20-го века были другие тенденции.

— Scortchi - Восстановить Монику

Эти послевоенные реформаторы неизвестны за пределами своей области именно потому, что они пришли после того, как дисциплина отступила в 20-30-х годах (после многовекового упадка крайних логических позитивистов, просто ускорившихся) в бесполезность, от которой она никогда не оправилась. Ущерб уже был нанесен. К 50-м годам другие академические дисциплины перестали обращать внимание на философию лидерства и с тех пор часто относились к ней с откровенным пренебрежением, из-за неприязни, придирчивости педантизма. Хотелось бы, чтобы это было не так. Изображение может не отражать реальность философии, но порча все еще остается.

— SQLServerSteve

Я был бы рад обсудить это в чате на следующей неделе, если у вас есть время, я не хочу касаться этой темы, но подозреваю, что наши позиции не так уж далеко друг от друга. Я думаю, что вы совершенно правы, движение, которое привело к Кардашьяну и т. Д., Началось с начала 20-го века - как раз в то время, когда дисциплина философии впала в затмение (заслуживает ли это того, другой вопрос; я считаю его очень важным). практично и жаль, что это все еще высоко ценится)

— SQLServerSteve

Комментарии не для расширенного обсуждения; этот разговор был перенесен в чат .

— Scortchi - Восстановить Монику

Все модели бесполезны? Возможна ли какая-то точная модель - или полезная?