Переход от использования статистического программного обеспечения для понимания математических уравнений?


12

Контекст:

Я аспирант кафедры психологии. Как и многие аспиранты по психологии, я знаю, как выполнять различные статистические анализы с использованием статистического программного обеспечения, вплоть до таких методов, как PCA, деревья классификации и кластерный анализ. Но это не совсем удовлетворительно, потому что, хотя я могу объяснить, почему я провел анализ и что означают показатели, я не могу объяснить, как работает методика.

Настоящая проблема заключается в том, что освоить статистическое программное обеспечение легко, но оно ограничено. Для изучения новых методов в статьях необходимо, чтобы я понимал, как читать математические уравнения. В настоящее время я не могу рассчитать собственные значения или K-средних. Уравнения для меня как иностранный язык.

Вопрос:

  • Существует ли исчерпывающее руководство, помогающее понять уравнения в журнальных статьях?

Редактировать:

Я думал, что вопрос будет более понятен: выше определенной сложности статистическая запись для меня становится бредом; скажем, я хотел бы написать свои собственные функции на R или C ++, чтобы понять технику, но есть барьер. Я не могу преобразовать уравнение в программу. И действительно: я не знаю ситуацию в американских докторских школах, но в моей (Франция) единственные курсы, которые я могу пройти, - это какое-то литературное движение 16-го века ...


@Coronier Извините, я сомневаюсь, что есть всеобъемлющее руководство для понимания статей по психологии, которые используют статистическое моделирование. Но необходимый фон должен быть на уровне степени магистра в области статистики. Если ваша программа за это заплатит, подумайте о получении степени магистра по статистике. Следующим лучшим вариантом для ваших целей может быть повторный анализ версии многовариантной статистики отдела статистики - обычно они содержат примечания с математическим фоном для PCA, кластеризации, деревьев и т. Д. Вам понадобится фон по линейной алгебре и базовым математическим вычислениям. статистика вне зависимости.
закрыто

Пожалуйста, задавайте более конкретные вопросы.

4
Я также аспирант по психологии, и я выбрал значительное количество математики в годы обучения в колледже, потому что было очень много докторов психологии, которые не имеют представления о том, как вычисляется PCA (например). Самое первое, что вам нужно сделать, это пройтись по любому приличному учебнику по линейной алгебре. Что такое приличный учебник по линейной алгебре? Гилберт Странг - бомба, и у него есть видео лекции курса линейной алгебры на сайте MIT для загрузки. Вы даже можете получить их на ITunes.
Филип Клауд

1
Вопрос настолько широк, что он не получит удовлетворительного ответа в нескольких параграфах. Статистика похожа на вопросы: становится проще, если разбить ее на несколько управляемых компонентов.
о.

Я могу только согласиться с вышеуказанными комментариями. Либо вам придется сосредоточиться на конкретной проблеме, либо вам просто нужно сначала пройтись по некоторым учебникам или раздаточным материалам в Интернете. Приличный учебник, который охватывает основные понятия для многомерной статистики с иллюстрациями, - « Математические инструменты для прикладного многомерного анализа » Кэрролла и Грина (AP, 1997, Rev. Ed.). Другой пример - « Прикладная многомерная статистика и математическое моделирование » Тинсли и Брауна (AP, 2000).
ЧЛ

Ответы:


9

Обзор:

  • У меня сложилось впечатление, что ваш опыт является общим для многих студентов в области социальных наук.
  • Отправной точкой является мотивация к обучению.
  • Вы можете идти по пути самообучения или формального обучения .

Формальная инструкция:

Есть много вариантов в этом отношении. Вы могли бы рассмотреть мастеров в области статистики или просто взять несколько предметов в отделе статистики. Тем не менее, вы, вероятно, захотите проверить, что у вас есть необходимые математические знания. В зависимости от курса, вы можете обнаружить, что вам нужно вернуться к математике до исчисления и, возможно, к некоторым материалам, таким как исчисление и линейная алгебра, прежде чем приступить к изучению математически строгих предметов статистики на уровне университета.

Самоучка

Кроме того, вы можете пойти по пути самоучки. В интернете куча хороших ресурсов. В частности, чтение и выполнение упражнений в учебниках по математике важно, но, вероятно, недостаточно. Важно слушать инструкторов, говорящих о математике, и смотреть, как они решают проблемы.

Также важно подумать о своих математических целях и математических предпосылках, необходимых для достижения этих целей. Если уравнения для вас как иностранный язык, то вы можете обнаружить, что вам сначала нужно изучить элементарную математику.

Я подготовил несколько ресурсов, предназначенных для помощи людям, которые переходят от использования статистического программного обеспечения к пониманию основополагающей математики.


Спасибо, ресурсы, которые вы предоставляете, великолепны. Кстати, ваш блог полностью увлекся (я студент I / OP и использую R, для меня это как откровение).
Коронье

@Coronier Приятно встретить другого человека, который сочетает R с I / O Psych.
Джером Англим

3

У меня сложилось впечатление, что вы думаете, что вы можете получить представление о статистическом уравнении, запрограммировав его в R или C ++; ты не можешь Чтобы понять статистическое уравнение, найдите учебник для студентов с большим количеством домашних заданий в конце каждой главы, в котором содержится уравнение, а затем выполните домашнюю работу в конце главы, содержащей уравнение.

Например, чтобы понять PCA, вам нужно хорошее понимание линейной алгебры и, в частности, разложения по сингулярным числам. Изучая квантовые вычисления с помощью книги Майкла Нильсена, мне стало ясно, что мне нужно рассмотреть линейную алгебру. Я наткнулся на видео Гилберта Странга, они были чрезвычайно полезны в установлении фундаментального понимания концепций. Однако нюанс материала не дошел до тех пор, пока я не нашел книгу по линейной алгебре, в которой было много домашних заданий, а затем мне нужно было их решить.


4
@ schenectady, хотя я сочувствую вашей точке зрения, по крайней мере для меня, код R обеспечивает мост, который я могу использовать для лучшего понимания соответствующих уравнений и математики. При этом я искренне согласен с тем, что проблемы, статистика и математика в целом - это то, чему можно научиться только на практике.
richiemorrisroe

2

Я понимаю вашу трудность, так как у меня похожая проблема, когда я пытаюсь сделать что-то новое в статистике (я тоже аспирант, но в другой области). Я нашел исследование кода R весьма полезным, чтобы понять, как что-то вычисляется. Например, я недавно изучал, как использовать kmeansкластеризацию, и у меня много базовых вопросов, как концептуальных, так и о том, как это реализовано. Используя Rустановку (я рекомендую R Studio, http://www.rstudio.org/ , но любая установка работает), просто введите kmeansв командной строке. Вот пример части вывода:

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

Я не уверен, насколько практично каждый раз исследовать источник, но это действительно помогает мне понять, что происходит, при условии, что вы немного знакомы с синтаксисом.

Предыдущий вопрос, который я задавал о stackoverflow, указал мне в этом направлении, но также помог мне сказать, что комментарии о коде иногда включаются сюда .


В более общем смысле, « Журнал статистического программного обеспечения» иллюстрирует эту связь между теорией и реализацией, но он часто касается продвинутых тем (что лично мне трудно понять), но полезен в качестве примера.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.