Я ищу корреляции между ответами на разные вопросы в опросе («хмм, давайте посмотрим, соотносятся ли ответы на вопрос 11 с ответами на вопрос 78»). Все ответы являются категоричными (большинство из них варьируются от «очень несчастных» до «очень счастливых»), но у некоторых есть другой набор ответов. Большинство из них можно считать порядковыми, поэтому давайте рассмотрим этот случай здесь.
Поскольку у меня нет доступа к программе коммерческой статистики, я должен использовать R.
Я попробовал Rattle (бесплатный пакет интеллектуального анализа данных для R, очень изящный), но, к сожалению, он не поддерживает категориальные данные. Один хак, который я мог бы использовать, это импортировать в R закодированную версию опроса, которая имеет цифры (1..5) вместо «очень несчастный» ... «счастливый», и пусть Рэттл считает, что это числовые данные.
Я думал сделать точечный график и иметь размер точки, пропорциональный количеству чисел для каждой пары. После некоторого поиска в Google я нашел http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/, но это кажется очень сложным (для меня).
Я не статистик (но программист), но кое-что прочитал по этому вопросу, и, если я правильно понял, здесь подходит Spearman rho .
Итак, короткая версия вопроса для тех, кто спешит: есть ли способ быстро нарисовать ро Спирмена в R ? График предпочтительнее, чем матрица чисел, потому что он легче для глаз, а также может быть включен в материалы.
Заранее спасибо.
PS Некоторое время я размышлял, стоит ли публиковать это на главном SO сайте или здесь. После поиска обоих сайтов на предмет R-корреляции я почувствовал, что этот сайт лучше подходит для этого вопроса.