Что такое французский анализ данных?


9

Некоторые статистические методы - я не помню, если это анализ основных компонентов или что-то в этом роде - иногда называют «французским анализом данных». Что именно? И некоторые люди говорят, что это имя иронично, правда ли и почему?


1
Хороший вопрос! Только вчера я заметил, что Analyze des données - это « приятная статья» во французской Википедии, и что ее содержание сильно отличается от статьи по анализу данных в английской Википедии .
Одна остановка

4
Может быть, эта статья интересна: Многофакторный анализ данных: французский путь
Тим

2
Эта статья, кажется, отвечает на вопрос - и это первый хит в Google. Может быть, это был не очень хороший вопрос в конце концов ...
2012 г.

2
там должны быть вовлечены языки
Аксакал

Ответы:


16

Анализ данных во французском стиле обычно определяется как работа, основанная на анализе соответствия и другой спектрально-ориентированной работе, но на самом деле он более глубоко обоснован. Ссылка Тима на произведение Холмса здесь особенно полезна.

Немного общая картина будет означать, что французский стиль использует аксиоматический, геометрический и математический подход к матрицам данных, а не статистическому моделированию. Термин должен быть немного ироничным, потому что, хотя CA был популяризирован Benzecri, LeBart и т. Д. (Французский), у него есть предшественники в Hirschfeld (немецкий) и преемники в de Leeuw / Gifi (голландский) и популяризаторы в Greenacre (южноафриканский). Greenacre также отметил важную связь с обобщенным СВД и создал для меня единственную легко читаемую книгу по этой теме. Обсуждения могут стать едкими - см. Обзор де Леу Муртага .

Полезный пример для сравнения последствий стиля - анализ кросс-таблиц. С помощью простой кросс-таблицы можно сравнить «французский» стиль простого анализа соответствия, основанного на спектральном разложении соответствующим образом преобразованной таблицы, с моделированием ассоциаций (например, Гудманом, Клоггом или Хаберманом) на основе структурированных терминов взаимодействия в базовой логарифмической линейной модели. , На самом деле эти два подхода генерируют очень похожие параметризации (и параметры!), Но фокус совсем другой. Агрести (1990) имеет отличную дискуссию.


1
То, что вы упомянули команду Gifi (также известную как Leiden Univ. Nom de plume ), и работа Greenacre действительно хороша! Я просто перечитываю книгу, где авторы подробно обсуждают ваш последний абзац. Мой большой +1.
ЧЛ

3

Может быть, «анализ соответствия»? : http://en.wikipedia.org/wiki/Correspondence_analysis, потому что он был первоначально разработан французским исследователем Жаном-Полем Бенцекри?


1
Один из них сказал мне, что этот «многомерный анализ французских данных» был иронично назван «французским анализом данных», потому что в то время, когда эти методы создавались, они были практически неосуществимы (слишком требовательны к вычислениям).
Стефан Лоран

2
Florian> Разработано Benzecri и активно используется Bourdieu.

2
@ StéphaneLaurent: несмотря на то, что аксиоматизация проходила через забор в типичной французской манере, Analyze des Données был практичным и использованным. Если вы можете получить «Cahiers de l'Analyse des Données» , вы можете проверить это!
Сиань
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.