Вопросы с тегом «r»

Используйте этот тег для любого * по теме * вопроса, который (a) включает `R` либо в качестве критической части вопроса, либо в ожидаемом ответе, & (b) не * просто * о том, как использовать` R`.

6
Какую реализацию теста перестановки в R использовать вместо t-тестов (парных и непарных)?
У меня есть данные из эксперимента, которые я проанализировал с помощью t-тестов. Зависимая переменная масштабируется по интервалу, а данные либо непарные (т. Е. 2 ​​группы), либо парные (т. Е. Внутри-субъекты). Например (в рамках предметов): x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, 99.5, 99.5, 57, 100, 99.5, 99.5, 99, …

8
Как смоделировать данные, которые удовлетворяют определенным ограничениям, таким как наличие определенного среднего значения и стандартного отклонения?
Этот вопрос мотивирован моим вопросом о метаанализе . Но я полагаю, что это также было бы полезно при обучении контекстов, в которых вы хотите создать набор данных, который точно отражает существующий опубликованный набор данных. Я знаю, как генерировать случайные данные из данного распределения. Так, например, если я читаю о результатах …

4
Выбор между LM и GLM для лог-преобразованной переменной ответа
Я пытаюсь понять философию использования Обобщенной линейной модели (GLM) по сравнению с линейной моделью (LM). Я создал пример набора данных ниже, где: журнал( у) = x + εlog⁡(y)=x+ε\log(y) = x + \varepsilon В этом примере ошибка εε\varepsilon зависит от величины Yyy , поэтому я предположил бы, что линейная модель лог-преобразованного …

3
Вопросы о том, как случайные эффекты указаны в lmer
Недавно я измерил, как значение нового слова приобретается после многократных воздействий (практика: день с 1 по 10) путем измерения ERP (ЭЭГ), когда слово рассматривалось в разных контекстах. Я также контролировал свойства контекста, например, его полезность для открытия нового значения слова (высокий или низкий). Меня особенно интересует эффект от практики (дней). …

6
Альтернативы логистической регрессии в R
Мне бы хотелось, чтобы столько алгоритмов выполняли ту же задачу, что и логистическая регрессия. Это алгоритмы / модели, которые могут дать прогноз двоичного ответа (Y) с некоторой пояснительной переменной (X). Я был бы рад, если после того, как вы назовете алгоритм, если вы также покажете, как реализовать его в R. …

9
Как R и Python дополняют друг друга в науке о данных?
Похоже, что во многих руководствах или руководствах описательная часть R и python сосуществуют как дополнительные компоненты процесса анализа. Однако на мой неподготовленный взгляд кажется, что оба языка делают одно и то же. Поэтому мой вопрос: существуют ли действительно специализированные ниши для двух языков или это просто личное предпочтение - использовать …
54 r  python  software 

3
Использование анализа основных компонентов (PCA) для выбора функций
Я новичок в выборе функций, и мне было интересно, как вы будете использовать PCA для выбора функций. Вычисляет ли PCA относительную оценку для каждой входной переменной, которую можно использовать для фильтрации неинформативных входных переменных? По сути, я хочу иметь возможность упорядочивать исходные элементы данных по отклонениям или количеству содержащейся информации.

3
Бокс-Кокса как преобразование для независимых переменных?
Существует ли преобразование типа Бокса-Кокса для независимых переменных? То есть преобразование, которое оптимизирует переменную так, чтобы она более подходила для линейной модели?Иксxxy~f(x) Если да, есть ли функция для выполнения этого R?

3
API данных / каналы доступны как пакеты в R
РЕДАКТИРОВАТЬ: Представление задачи « Веб-технологии и службы CRAN» содержит гораздо более полный список источников данных и API-интерфейсов, доступных в R. Вы можете отправить запрос на извлечение на github, если вы хотите добавить пакет в представление задач. Я делаю список различных каналов данных, которые уже подключены к R или которые легко …
53 r  references  dataset 

6
Имеют ли предсказания модели случайного леса интервал предсказания?
Если я запускаю randomForestмодель, я могу делать прогнозы на основе этой модели. Есть ли способ получить интервал прогнозирования для каждого из прогнозов, чтобы я знал, насколько «уверена» модель в своем ответе. Если это возможно, то просто ли это основано на изменчивости зависимой переменной для всей модели или она будет иметь …

6
Как определить лучшую точку отсечения и ее доверительный интервал, используя кривую ROC в R?
У меня есть данные теста, который можно использовать для различения нормальных и опухолевых клеток. Согласно кривой ROC это выглядит хорошо для этой цели (площадь под кривой составляет 0,9): Мои вопросы: Как определить точку отсечки для этого теста и его доверительный интервал, где показания следует оценивать как неоднозначные? Каков наилучший способ …

6
Какую книгу рекомендуется начинать изучать статистику одновременно с использованием R?
Книги для изучения статистики с использованием R Какую именно книгу я ищу. То, что я ищу, это книга, которая обучает вас статистике, используя R, чтобы дать вам практический опыт и, таким образом, в конечном итоге помогает вам изучать R вместе. Я видел на Амазонке много книг, которые пытаются это сделать, …
50 r  references 

1
Получение прогнозных значений (Y = 1 или 0) из модели логистической регрессии
Допустим, у меня есть объект класса glm(соответствующий модели логистической регрессии), и я хотел бы превратить предсказанные вероятности, заданные с predict.glmпомощью аргумента, type="response"в двоичные ответы, то есть или Y = 0 . Какой самый быстрый и самый канонический способ сделать это в R?Y=1Y=1Y=1Y=0Y=0Y=0 Хотя, опять же , я знаю predict.glm, я …

1
Бутстрап против Джекниф
Как методы начальной загрузки, так и методы складного ножа могут быть использованы для оценки систематической ошибки и стандартной ошибки оценки, а механизмы обоих методов повторной выборки не сильно отличаются: выборка с заменой против пропуска одного наблюдения за раз. Тем не менее, складной нож не так популярен, как бутстрап в исследованиях …

4
Вычисление значения P вручную из t-значения в t-тесте
У меня есть образец набора данных с 31 значениями. Я выполнил двусторонний t-тест, используя R, чтобы проверить, равно ли истинное среднее значение 10: t.test(x=data, mu=10, conf.level=0.95) Выход: t = 11.244, df = 30, p-value = 2.786e-12 alternative hypothesis: true mean is not equal to 10 95 percent confidence interval: 19.18980 …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.