Мне нравится этот вопрос, потому что он касается политики, которая существует в каждой организации. На мой взгляд, и в значительной степени ожидания в отношении эффективности модели зависят от культуры организации и степени, в которой организация «технически грамотна». Один из способов прояснить, что я имею в виду, - рассмотреть различия между 4 крупными объектами «науки о данных» - Google, FB, Amazon и Yahoo - по сравнению с 4 крупными холдинговыми структурами - WPP, Omnicon, Interbrand и Publicis. Google и др. Очень технически грамотны. Агентства, с другой стороны, как известно, склоняются к технической фобии. Что является доказательством этого? Прежде всего, технически грамотная группа была основана или управляется инженерами, специалистами по компьютерам, фанатами и людьми с сильным техническим опытом. Кто управляет техническими неграмотными компаниями? Маркетологи, которые достигли известности благодаря их мягкому общению и человеческим навыкам. И не только потому, что, работая в некоторых из этих магазинов в Нью-Йорке, я могу засвидетельствовать, что эти организации систематически наказывают и / или вытесняют высокотехнологичные грамотные типы, которые не соответствуют культуре. Далее, рассмотрим их совокупные (фондовые) рыночные ограничения. Группа технико-грамотных людей добавляет до 800 миллиардов долларов, а группа неграмотных в сфере технологий - 80 миллиардов. Технологически грамотные предприятия в 10 раз больше, чем другие в рыночной капитализации. Это четкое утверждение ожиданий рынка, и оно невелико для неграмотных. Итак, с помощью экстраполяции, какую надежду вы можете иметь для того, чтобы бросить вызов ожиданиям «предсказательной точности» таких бозо? Работая в некоторых из этих магазинов в Нью-Йорке, я могу засвидетельствовать, что эти организации систематически наказывают и / или вытесняют высоко технически грамотные типы, которые не соответствуют культуре. Далее, рассмотрим их совокупные (фондовые) рыночные ограничения. Группа технико-грамотных людей добавляет до 800 миллиардов долларов, а группа неграмотных в сфере технологий - 80 миллиардов. Технологически грамотные предприятия в 10 раз больше, чем другие в рыночной капитализации. Это четкое утверждение ожиданий рынка, и оно невелико для неграмотных. Итак, с помощью экстраполяции, какую надежду вы можете иметь для того, чтобы бросить вызов ожиданиям «предсказательной точности» таких бозо? Работая в некоторых из этих магазинов в Нью-Йорке, я могу засвидетельствовать, что эти организации систематически наказывают и / или вытесняют высоко технически грамотные типы, которые не соответствуют культуре. Далее, рассмотрим их совокупные (фондовые) рыночные ограничения. Группа технико-грамотных людей добавляет до 800 миллиардов долларов, а группа неграмотных в сфере технологий - 80 миллиардов. Технологически грамотные предприятия в 10 раз больше, чем другие в рыночной капитализации. Это четкое утверждение ожиданий рынка, и оно невелико для неграмотных. Итак, с помощью экстраполяции, какую надежду вы можете иметь для того, чтобы бросить вызов ожиданиям «предсказательной точности» таких бозо? Если учесть их совокупные (фондовые) рыночные ограничения, техническая грамотная группа составляет около 800 миллиардов долларов, а техническая неграмотная - 80 миллиардов. Технологически грамотные предприятия в 10 раз больше, чем другие в рыночной капитализации. Это четкое утверждение ожиданий рынка, и оно невелико для неграмотных. Итак, с помощью экстраполяции, какую надежду вы можете иметь для того, чтобы бросить вызов ожиданиям «предсказательной точности» таких бозо? Если учесть их совокупные (фондовые) рыночные ограничения, техническая грамотная группа составляет около 800 миллиардов долларов, а техническая неграмотная - 80 миллиардов. Технологически грамотные предприятия в 10 раз больше, чем другие в рыночной капитализации. Это четкое утверждение ожиданий рынка, и оно невелико для неграмотных. Итак, с помощью экстраполяции, какую надежду вы можете иметь для того, чтобы бросить вызов ожиданиям «предсказательной точности» таких бозо?
Таким образом, учитывая этот культурный прорыв и в зависимости от того, где вы упали, у вас должны быть более или менее реалистичные ожидания. Конечно, в разных «неграмотных» организациях будут менеджеры, которые знают, что делают, но по большей части в этих объектах преобладает идиотизм наименьшего общего знаменателя технических навыков, то есть людей, которые в лучшем случае являются техническими полуграмотные (и опасные) или, чаще, совершенно неисчислимые, но не знают этого. Например, я работал на парня, который хотел, чтобы слова типа «корреляция» были вычеркнуты из колоды c-suite. Это крайний случай: в конце концов, каждый секретарь знает, что такое «корреляция».
Это поднимает вопрос о том, как справляться с безумно наивным и неисчислимым числом, когда они задают действительно тупой вопрос, такой как: «Почему вы не получаете 99% -ную точность предсказания?» Один хороший ответ - ответить на вопрос типа: «Почему вы предполагаете, что такой нереально высокий ПА даже возможен?» Другой может быть: «Потому что, если бы я на самом деле получил 99% ПА, я бы предположил, что я делаю что-то не так». Что весьма вероятно, чтобы быть правдой, даже с 90% ПА.
Существует более фундаментальный вопрос о настойчивости в отношении PA как единственного критерия ценности модели. Покойный Лео Брейман оставил много следов в сообществе статистического и прогностического моделирования, одним из которых является PA. Его основной задачей в PA было рассмотрение многих критических замечаний, высказанных в 90-х годах в отношении нестабильности и ошибок, присущих запуску одного дерева CART. Его решение состояло в том, чтобы мотивировать «случайные леса» как приблизительный и временный метод, который позволил бы максимально повысить точность и уменьшить нестабильность за счет устранения древовидной структуры. Он сравнил более низкое значение MSE из ~ 1000 итеративных «мини-моделей» RF с ошибкой из одной модели логистической регрессии. Единственная проблема заключалась в том, что он никогда не удосужился упомянуть сравнение вопиющих яблок с апельсинами:
Приз Netflix 2008 года предложил значительное денежное вознаграждение любому статистику или команде, способной улучшить MSE своей системы рекомендаций. В то время Netflix тратил 150 миллионов долларов в год на эту систему, убежденный, что затраты были более чем возмещены за счет лояльности клиентов и покупки фильмов, которые иначе никогда бы не были выбраны. Возможные победители использовали сложный ансамбль из 107 различных моделей.
Однако, как выяснил Netflix, реальная проблема заключалась в том, что с точки зрения полностью загруженных затрат фактическое улучшение погрешности по сравнению с их текущей моделью составило всего лишь 0,005% -ное снижение рейтинга на 5 баллов. Не говоря уже о том, что ИТ-затраты во времени, тяжелые работы и обслуживание победившего ансамбля из 107 моделей более чем сводят на нет любые выгоды от уменьшения ошибок. Учитывая это, Netflix в конечном итоге отказался от погони за MSE, и больше не было присуждено никаких призов Netflix.
И в этом суть: минимизация ошибки прогнозирования может быть легко подстроена или взломана и подвержена мошенничеству аналитика (то есть, найти решение, которое прославляет навыки моделирования аналитика, положительно влияя на его потенциальный бонус на конец года). Более того, это полностью статистическое решение и цель, поставленные в экономическом и деловом вакууме. Метрика практически не учитывает вспомогательные, сопутствующие расходы - очень реальные операционные последствия, оцениваемые от А до Я, которые должны быть неотъемлемой частью любого полностью загруженного процесса принятия решений, основанного на компромиссе.
Это стало одной из тех проблем, которая заложена в организациях и которую очень, очень трудно изменить. Другими словами, я полностью осознаю, что я склоняюсь к ветряным мельницам с этими разговорами о предостережениях с использованием PA.