Вопросы с тегом «data-transformation»

Математическое переопределение, часто нелинейное, значений данных. Данные часто преобразуются либо для соответствия допущениям статистической модели, либо для того, чтобы сделать результаты анализа более понятными.

5
Как изменить данные между широким и длинным форматами в R? [закрыто]
Вы можете иметь данные в широком формате или в длинном формате. Это довольно важная вещь, так как используемые методы различаются в зависимости от формата. Я знаю, что вы должны работать melt()иcast() пакетом измененных форм из него, но есть некоторые вещи, которые я не понимаю. Может кто-нибудь дать мне краткий обзор, …

4
Анализ со сложными данными, что-нибудь другое?
Скажем, например, вы делаете линейную модель, но данные сложны.yyy y=xβ+ϵy=xβ+ϵ y = x \beta + \epsilon Мой набор данных сложен, так как все числа в имеют форму . Есть ли что-то процедурное при работе с такими данными?( а + б я )yyy(a+bi)(a+bi)(a + bi) Я спрашиваю, потому что вы в …

2
Каковы предположения об отрицательной биномиальной регрессии?
Этот вопрос был перенесен из Математического стека обмена, потому что на него можно ответить по перекрестной проверке. Мигрировал 6 лет назад . Я работаю с большим набором данных (конфиденциально, поэтому я не могу поделиться слишком много), и пришел к выводу, что отрицательный биномиальный регресс будет необходим. Я никогда не проводил …

3
Всегда ли хорошо отбеливать?
Обычным этапом предварительной обработки алгоритмов машинного обучения является отбеливание данных. Кажется, что всегда полезно делать отбеливание, так как оно не коррелирует данные, что упрощает их моделирование. Когда отбеливание не рекомендуется? Примечание: я имею в виду декорреляцию данных.

2
Преобразование переменных для множественной регрессии в R
Я пытаюсь выполнить множественную регрессию в R. Однако моя зависимая переменная имеет следующий график: Вот матрица диаграммы рассеяния со всеми моими переменными ( WARэто зависимая переменная): Я знаю, что мне нужно выполнить преобразование для этой переменной (и, возможно, независимых переменных?), Но я не уверен в том, какое именно преобразование требуется. …

3
Матрица нормализации по столбцам в R [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 6 лет назад . Я хотел бы выполнить по столбцам нормализацию матрицы в R. Учитывая матрицу m, я хочу нормализовать каждый столбец путем деления …

4
Когда регистрировать преобразование временного ряда перед установкой модели ARIMA
Ранее я использовал прогноз Pro для прогнозирования одномерных временных рядов, но переключаю свой рабочий процесс на R. Пакет прогноза для R содержит много полезных функций, но он не выполняет никаких преобразований данных перед запуском auto. .arima (). В некоторых случаях прогноз Pro решает записать данные преобразования, прежде чем делать прогнозы, …

3
Как смоделировать это распределение нечетной формы (почти наоборот-J)
Моя зависимая переменная, показанная ниже, не подходит ни под какой дистрибутив, который я знаю. Линейная регрессия приводит к несколько ненормальным отклонениям в правильном направлении, которые странным образом относятся к предсказанному Y (2-й график). Какие-либо предложения для преобразований или других способов получить наиболее достоверные результаты и лучшую точность прогнозирования? Если возможно, …

7
Например, почему пол обычно кодируется 0/1, а не 1/2?
Я понимаю логику кодирования для анализа данных. Мой вопрос ниже касается использования определенного кода. Есть ли причина, по которой пол часто кодируется как 0 для женщин и 1 для мужчин? Почему эта кодировка считается «стандартной»? Сравните это с Женский = 1 и Мужской = 2. Есть ли проблема с этим …

3
Почему силовые или логарифмические преобразования не преподаются в машинном обучении?
Машинное обучение (ML) активно использует методы линейной и логистической регрессии. Он также опирается на особенность инженерных методов ( feature transform, kernel, и т.д.). Почему нет ничего о variable transformation(например power transformation) , упомянутые в ML? (Например, я никогда не слышал о получении root или log к объектам, они обычно просто …

6
Примеры расширенного регрессионного моделирования
Я ищу расширенное тематическое исследование линейной регрессии, иллюстрирующее шаги, необходимые для моделирования сложных, множественных нелинейных отношений с использованием GLM или OLS. На удивление трудно найти ресурсы, выходящие за рамки базовых школьных примеров: большинство книг, которые я прочитал, не пойдет дальше, чем лог-преобразование ответа в сочетании с BoxCox одного предиктора или …

4
Трансформация для увеличения эксцесса и асимметрии нормального течения
Я работаю над алгоритмом, который основан на том факте, что наблюдения s обычно распределяются, и я хотел бы проверить надежность алгоритма в этом предположении эмпирически.YYY Чтобы сделать это, я искал последовательность преобразований , которые постепенно разрушают нормальности . Например, если нормальны, они имеют асимметрию и kurtosis , и было бы …

3
Как интерпретировать коэффициенты регрессии, когда ответ был преобразован 4-м корнем?
Я использую четвертое 1/4преобразование степени root ( ) в моей переменной ответа в результате гетероскедастичности. Но сейчас я не знаю, как интерпретировать мои коэффициенты регрессии. Я предполагаю, что мне понадобится взять коэффициенты до четвертой степени при обратном преобразовании (см. Ниже результат регрессии). Все переменные выражены в долларах в миллионах, но …

6
Изменение масштаба переменной на 0-100
Я построил индекс социального капитала с использованием методики PCA. Этот индекс содержит значения как положительные, так и отрицательные. Я хочу преобразовать / преобразовать этот индекс в масштаб 0-100, чтобы его было легко интерпретировать. Пожалуйста, предложите мне самый простой способ сделать это.

2
Выбор метода сезонного разложения
Сезонная корректировка является решающим этапом предварительной обработки данных для дальнейших исследований. Исследователь, однако, имеет несколько вариантов сезонного разложения по трендовому циклу. Наиболее распространенными (судя по количеству ссылок в эмпирической литературе) конкурентными методами сезонного разложения являются X-11 (12) -ARIMA, Tramo / Seats (оба реализованы в Demetra + ) и 's stlRRR …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.