Примерно в 2005 году, когда «Data Mining» была последней угрозой для статистической профессии, я помню, как видел плакат с «Принципами Data Mining», один из которых был «пусть данные говорят» (не помню, если «для себя») был включен). Если вы подумаете об алгоритмах, которые можно считать «интеллектуальным анализом данных», вам на ум придут априорные и рекурсивные методы разделения, два алгоритма, которые могут быть мотивированы без статистических допущений и приводят к довольно простым обобщениям базового набора данных.
@Ben понимает больше истории этой фразы, чем я, но думаю о цитате, приведенной в статье:
MCA может рассматриваться как аналог PCA для категориальных данных и включает в себя уменьшение размерности данных, чтобы обеспечить подпространство, которое наилучшим образом представляет данные в смысле максимизации изменчивости проецируемых точек. Как уже упоминалось, он часто представлен без какой-либо ссылки на вероятностные модели, в соответствии с идеей Бенцкри [1973] «позволить данным говорить самим за себя».
мне кажется, что процедура MCA действительно напоминает априорное или рекурсивное разбиение (или ад, среднее арифметическое значение в этом отношении) в том смысле, что она может быть мотивирована вообще без какого-либо моделирования и является механической операцией над набором данных, которая имеет смысл на основе на некоторых первых принципах.
Существует спектр предоставления данных говорить. Полностью байесовские модели с сильными приорами были бы на одном конце. Частые непараметрические модели были бы ближе к другому концу.