Я читаю Черного лебедя пару лет назад. Идея Черного лебедя хороша, и атака на нелепую ошибку (видя вещи, как будто они являются играми в кости, с известными вероятностями) хороша, но статистика возмутительно искажена, с центральной проблемой является неправильное утверждение, что вся статистика разваливается, если переменные обычно не распространяются. Я был достаточно раздражен этим аспектом, чтобы написать Талебу письмо ниже:
Уважаемый доктор Талеб
Я недавно прочитал «Черный лебедь». Как и вы, я фанат Карла Поппера, и я согласился со многим, что есть в нем. Я думаю, что ваше изложение ложной ошибки в основном обоснованно и привлекает внимание к реальной и распространенной проблеме. Тем не менее, я думаю, что значительная часть третьей части плохо подводит ваш общий аргумент, вплоть до возможной дискредитации остальной части книги. Это позор, так как я думаю, что аргументы в отношении Черных лебедей и «неизвестных неизвестных» основаны на их достоинствах, не полагаясь на некоторые ошибки в части III.
Основной вопрос, на который я хотел бы обратить внимание - и требовать вашего ответа, особенно если у меня возникли проблемы, - это искажение вами области прикладной статистики. По моему мнению, главы 14, 15 и 16 в значительной степени зависят от аргумента соломенного человека, искажающего представления статистики и эконометрики. Область эконометрики, которую вы описываете, - не та, которой меня учили, когда я изучал прикладную статистику, эконометрику и теорию актуарного риска (в Австралийском национальном университете, но с использованием текстов, которые казались довольно стандартными). Вопросы, которые вы поднимаете (такие как ограничения гауссовых распределений), хорошо и верно поняты и изучены даже на уровне бакалавриата.
Например, вы пойдете на несколько шагов, чтобы показать, как распределение доходов не соответствует нормальному распределению, и представить это как аргумент против статистической практики в целом. Ни один компетентный статистик никогда не станет утверждать, что это так, и способы решения этой проблемы хорошо известны. Например, простое использование методов самого базового уровня «эконометрики первого года», преобразование переменной с помощью ее логарифма сделает ваши численные примеры гораздо менее убедительными. Такое преобразование фактически лишит законной силы многое из того, что вы говорите, потому что тогда дисперсия исходной переменной действительно увеличивается с увеличением ее среднего значения.
Я уверен, что есть некоторые некомпетентные эконометрики, которые проводят регрессию OLS и т. Д. С нетрансформированной переменной отклика, как вы говорите, но это просто делает их некомпетентными и использует методы, которые, как известно, неуместны. Они, безусловно, были бы неудачными даже на курсах бакалавриата, которые проводят много времени в поисках более подходящих способов моделирования переменных, таких как доход, отражающих фактическое наблюдаемое (негауссовское) распределение.
Семейство обобщенных линейных моделей - это один набор методов, разработанный частично для решения проблем, которые вы поднимаете. Многие экспоненциальные семейства распределений (например, гамма-распределения, экспоненциальные распределения и распределения Пуассона) являются асимметричными и имеют дисперсию, которая увеличивается с увеличением центра распределения, что позволяет обойти проблему, на которую вы указали, используя распределение Гаусса. Если это все еще слишком ограничивает, можно вообще отбросить ранее существовавшую «форму» и просто указать связь между средним значением распределения и его дисперсией (например, позволяя дисперсии увеличиваться пропорционально квадрату среднего значения), с использованием метода оценки «квази-правдоподобия».
Конечно, вы можете утверждать, что эта форма моделирования все еще слишком упрощена и интеллектуальная ловушка, которая заставляет нас думать, что будущее будет таким же, как прошлое. Вы можете быть правы, и я думаю, что сила вашей книги в том, чтобы заставить таких людей, как я, задуматься над этим. Но вам нужны аргументы, отличные от тех, которые вы используете в главах 14-16. Большой вес, который вы придаете тому факту, что дисперсия гауссовского распределения постоянна независимо от ее среднего значения (что вызывает проблемы с масштабируемостью), например, недопустима. Так что вы акцентируете внимание на том факте, что реальные распределения имеют тенденцию быть ассиметричными, а не изогнутыми.
По сути, вы взяли одно упрощение самого основного подхода к статистике (наивное моделирование необработанных переменных как гауссовых распределений) и в большой степени продемонстрировали (правильно) недостатки такого упрощенного подхода. Затем вы используете это, чтобы сделать разрыв, чтобы дискредитировать всю область. Это либо серьезная ошибка в логике, либо метод пропаганды. Это прискорбно, потому что это умаляет ваш общий аргумент, большая часть которого (как я уже сказал) я нашел обоснованным и убедительным.
Мне было бы интересно услышать, что вы говорите в ответ. Я сомневаюсь, что я первый поднял этот вопрос.
Искренне Ваш
PE