Вопросы с тегом «nonparametric»

Используйте этот тег, чтобы узнать о природе непараметрических или параметрических методов или о различии между ними. Непараметрические методы обычно основаны на нескольких предположениях о базовых распределениях, тогда как параметрические методы делают предположения, которые позволяют данным описываться небольшим количеством параметров.

2
Непараметрический байесовский анализ в R
Я ищу хороший учебник по кластеризации данных при Rиспользовании иерархического процесса Дирихле (HDP) (один из последних и популярных непараметрических байесовских методов). Существует DPpackage(ИМХО, самый полный из всех доступных) Rдля непараметрического байесовского анализа. Но я не могу понять примеры, приведенные в R Newsсправочном руководстве или в пакете, достаточно хорошо, чтобы кодировать …

2
Если переменные ширины ядра часто хороши для регрессии ядра, почему они вообще не хороши для оценки плотности ядра?
Этот вопрос вызван обсуждением в другом месте . Переменные ядра часто используются в локальной регрессии. Например, loess широко используется и работает как сглаживающая регрессия, и основан на ядре переменной ширины, который адаптируется к разреженности данных. С другой стороны, считается, что переменные ядра приводят к плохим оценкам в оценке плотности ядра …

2
Как запустить двухстороннюю ANOVA на данных без нормальности и равенства дисперсии в R?
Сейчас я работаю над магистерской диссертацией и планирую запустить статистику с SigmaPlot. Однако, проведя некоторое время со своими данными, я пришел к выводу, что SigmaPlot может не подходить для моей проблемы (я могу ошибаться), поэтому я начал свои первые попытки в R, что не совсем облегчило задачу. План состоял в …

4
Что такое связанные данные в контексте рангового коэффициента корреляции?
Я не в области статистики. Я видел слово «связанные данные», когда читал о коэффициентах корреляции рангов. Что такое привязанные данные? Что является примером связанных данных?

5
Проверка предположений ANOVA
Несколько месяцев назад я опубликовал вопрос о тестах гомоскедастичности в R на SO, и Ян Феллоуз ответил на это (я перефразирую его ответ очень свободно): Тесты на гомоскедастичность не являются хорошим инструментом при проверке соответствия вашей модели. С небольшими выборками у вас недостаточно мощности, чтобы обнаружить отклонения от гомоскедастичности, в …

3
Непараметрическая многофакторная анова с повторными измерениями в R?
Следующий вопрос - один из тех святых Граалей для меня в течение некоторого времени, я надеюсь, что кто-то сможет дать хороший совет. Я хочу выполнить непараметрические повторные измерения многоходового анова с использованием R. Некоторое время я занимался поиском и чтением в Интернете и до сих пор смог найти решения только …

1
Должен ли я использовать t-тест для сильно искаженных данных? Научное доказательство, пожалуйста?
У меня есть образцы из сильно искаженного (похожего на экспоненциальный дистрибутив) набора данных об участии пользователей (например, количество постов), которые имеют разные размеры (но не менее 200), и я хочу сравнить их среднее значение. Для этого я использую непарные t-тесты с двумя образцами (и t-тесты с коэффициентом Уэлча, когда образцы …

4
Как выполнить регрессию для ненормальных данных, которые остаются ненормальными при преобразовании?
У меня есть некоторые данные (158 случаев), которые были получены из ответа по шкале Лайкерта на 21 вопросник. Я действительно хочу / нужно провести регрессионный анализ, чтобы увидеть, какие пункты в анкете предсказывают реакцию на общий элемент (удовлетворенность). Ответы обычно не распределяются (в соответствии с тестами KS), и я преобразовал …

1
Может ли начальная загрузка использоваться для замены непараметрических тестов?
Я довольно плохо знаком со статистикой. Концепция начальной загрузки меня смутила. Я знаю, что для нормального распределения выборки необходимо использовать определенные тесты, такие как t-критерий. В случаях, когда данные обычно не распространяются, запрос «начальной загрузки» в t-тестах в SPSS обойдёт ли это проблему ненормальности? Если да, то является ли t-статистика, …

1
Когда / где использовать функциональный анализ данных?
Я очень плохо знаком с функциональным анализом данных (FDA). Я читаю: Ramsay, James O. и Silverman, Bernard W. (2006), Functional Analysis Data, 2nd ed., Springer, New York. Тем не менее, я до сих пор не очень ясно, где / когда использовать FDA? Может ли кто-нибудь дать мне пример, особенно в …

5
Является ли логистическая регрессия непараметрическим тестом?
Я недавно получил следующий вопрос по электронной почте. Я выложу ответ ниже, но мне было интересно услышать, что думают другие. Вы бы назвали логистическую регрессию непараметрическим тестом? Насколько я понимаю, простой маркировки теста непараметрическим, потому что его данные обычно не распределяются, недостаточно. Это больше связано с отсутствием предположений. Логистическая регрессия …

1
Что такое «Целевое ожидание максимального правдоподобия»?
Я пытаюсь понять некоторые работы Марка ван дер Лаана. Он - теоретический статистик в Беркли, работающий над проблемами, которые существенно пересекаются с машинным обучением. Одна проблема для меня (помимо глубокой математики) состоит в том, что он часто заканчивает тем, что описывает знакомые подходы машинного обучения, используя совершенно другую терминологию. Одна …

3
Проверьте, совпадают ли многомерные распределения
Допустим, у меня есть две или более выборочных совокупностей n-мерных непрерывнозначных векторов. Есть ли непараметрический способ проверить, относятся ли эти образцы к одному и тому же распределению? Если это так, есть ли функция в R или Python для этого?

2
Почему U-критерий Манна-Уитни имеет значение, когда медианы равны?
Я получил результаты теста ранга Манна-Уитни, которые я не понимаю. Медиана двух популяций идентична (6,9). Верхний и нижний квантили каждой популяции: 6.64 и 7.2 6.60 и 7.1 Значение р, полученное в результате теста, сравнивающего эти популяции, составляет 0,007. Как эти популяции могут значительно отличаться? Это из-за распространения о медиане? Бокплот, …

1
Есть ли альтернатива критерию Колмогорова-Смирнова для связанных данных с коррекцией?
У меня есть набор данных из двух выборок (контрольной и обработанной), каждая из которых содержит несколько тысяч значений, которые должны пройти проверку на значимость в R. Теоретически значения должны быть непрерывными, но из-за округления, выполняемого программным обеспечением для измерения, они не ' и у них есть связи. Распределения неизвестны, а …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.