Вопросы с тегом «data-transformation»

Математическое переопределение, часто нелинейное, значений данных. Данные часто преобразуются либо для соответствия допущениям статистической модели, либо для того, чтобы сделать результаты анализа более понятными.

4
Как обобщить категориальные данные?
Я боролся со следующей проблемой, надеюсь, она проста для статистиков (я программист, немного знакомый со статистикой). Мне нужно обобщить ответы на опрос (для руководства). В опросе содержится более 100 вопросов, сгруппированных по разным областям (от 5 до 10 вопросов на область). Все ответы являются категоричными (по порядковой шкале они похожи …

3
Экспресс-ответы в исходных единицах, в преобразованных Бокс-Коксом данных
Для некоторых измерений результаты анализа соответствующим образом представлены в преобразованной шкале. Однако в большинстве случаев желательно представлять результаты в исходной шкале измерений (в противном случае ваша работа более или менее бесполезна). Например, в случае данных, преобразованных в лог, возникает проблема с интерпретацией в исходной шкале, потому что среднее значение зарегистрированных …

5
Уменьшение размерности SVD для временных рядов различной длины
Я использую Singular Value Decomposition в качестве техники уменьшения размерности. Заданные Nвекторы размерностиD идея состоит в том, чтобы представить элементы в преобразованном пространстве некоррелированных измерений, в котором большая часть информации данных содержится в собственных векторах этого пространства в порядке убывания важности. Сейчас я пытаюсь применить эту процедуру к данным временных …

4
Модель регрессии, чья переменная ответа - день года, когда происходит ежегодное событие (обычно)
В данном конкретном случае я имею в виду день замерзания озера. Эта дата «обледенения» встречается только один раз в год, но иногда вообще не происходит (если зима теплая). Таким образом, в один год озеро может замерзнуть в день 20 (20 января), а в другой год оно может вообще не замерзнуть. …

2
Является ли визуализация достаточным основанием для преобразования данных?
проблема Я хотел бы изобразить дисперсию, объясняемую каждым из 30 параметров, например, как график с отдельной полосой для каждого параметра и дисперсию по оси y: Тем не менее, отклонения сильно отклонены к небольшим значениям, включая 0, как можно видеть на гистограмме ниже: Если я преобразую их в , будет легче …

1
Есть
Мой коллега хочет проанализировать некоторые данные после преобразования переменной ответа, подняв ее до степени (то естьу0,125).1818\frac18Y0,125y0.125y^{0.125} Мне неудобно с этим, но я не могу понять, почему. Я не могу придумать никакого механистического обоснования для этого преобразования. Также я никогда не видел этого раньше, и я волнуюсь, что, возможно, это раздувает …

1
Каков наиболее подходящий способ преобразования пропорций, когда они являются независимой переменной?
Я думал, что понял эту проблему, но теперь я не так уверен, и я хотел бы проверить с другими, прежде чем продолжить. У меня есть две переменные, Xи Y. Yявляется отношением, и оно не ограничено 0 и 1 и обычно нормально распределено. Xявляется пропорцией, и он ограничен 0 и 1 …

4
Подсказки, что проблема хорошо подходит для линейной регрессии
Я изучаю линейную регрессию, используя Введение в анализ линейной регрессии Монтгомери, Пека и Вайнинга . Я хотел бы выбрать проект анализа данных. У меня наивная мысль, что линейная регрессия подходит только тогда, когда подозревают, что существуют линейные функциональные отношения между объясняющими переменными и переменной отклика. Но не так много реальных …

2
Являются ли нормально распределенные X и Y более вероятными в результате нормально распределенных остатков?
Здесь обсуждается неправильное толкование предположения о нормальности в линейной регрессии (что «нормальность» относится к X и / или Y, а не к остаткам), и автор спрашивает, возможно ли иметь ненормально распределенные X и Y и все еще имеют нормально распределенные остатки. Мой вопрос: нормально ли распределены X и Y с …

3
Как преобразовать лептокуротическое распределение в нормальное состояние?
Предположим, у меня есть лептокуртическая переменная, которую я хотел бы преобразовать в нормальное состояние. Какие преобразования могут выполнить эту задачу? Мне хорошо известно, что преобразование данных может быть не всегда желательным, но в качестве академической цели, предположим, что я хочу «вбить» данные в нормальное русло. Кроме того, как видно из …

1
Критерии выбора «лучшей» модели в скрытой марковской модели
У меня есть набор данных временного ряда, к которому я пытаюсь подогнать скрытую марковскую модель (HMM), чтобы оценить количество скрытых состояний в данных. Мой псевдокод для этого следующий: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } …


1
Зачем использовать зарегистрированные переменные?
Возможно, это очень простой вопрос, но я, похоже, не смог найти на него убедительного ответа. Я надеюсь здесь, я могу. В настоящее время я читаю статьи в качестве подготовки к моей собственной магистерской диссертации. В настоящее время я читаю статью, в которой исследуется связь между твитами и особенностями фондового рынка. …

2
Что делать, если некоторые моменты времени имеют сильно искаженные отклики, а некоторые нет при повторном измерении?
Как правило, когда встречаются непрерывные, но искаженные показатели результата в продольном дизайне (скажем, с одним эффектом между субъектами), общий подход заключается в преобразовании результата в нормальность. Если ситуация экстремальная, например, с усеченными наблюдениями, можно подумать и использовать модель кривой роста Тобита или что-то подобное. Но я в недоумении, когда вижу …

2
Модели временных рядов с разницей в журналах лучше, чем темпы роста?
Часто я вижу, что авторы оценивают модель «логарифмической разницы», например log(yt)−log(yt−1)=log(yt/yt−1)=α+βxtlog⁡(yt)−log⁡(yt−1)=log⁡(yt/yt−1)=α+βxt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Я согласен, что уместно соотносить с процентным изменением тогда как - это .y t log ( y t ) I ( 1 )ИксTxTx_tYTYTy_tжурнал( уT)журнал⁡(YT)\log (y_t)я( 1 )я(1)I(1) Но логарифмическая разница является …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.