Вопросы с тегом «data-transformation»

Математическое переопределение, часто нелинейное, значений данных. Данные часто преобразуются либо для соответствия допущениям статистической модели, либо для того, чтобы сделать результаты анализа более понятными.

2
Извлечь данные из скользящей средней?
Можно ли извлечь точки данных из данных скользящего среднего? Другими словами, если набор данных имеет только простые скользящие средние из предыдущих 30 точек, возможно ли извлечь исходные точки данных? Если так, то как?

2
Канонический корреляционный анализ с ранговой корреляцией
Канонический корреляционный анализ (CCA) стремится максимизировать обычную корреляцию Пирсона с моментом произведения (то есть линейный коэффициент корреляции) линейных комбинаций двух наборов данных. Теперь рассмотрим тот факт , что этот коэффициент корреляции только измеряет линейные ассоциаций - это причина того, почему мы используем, например, Spearman- или Кендал (ранг) коэффициенты корреляции измеряющие …

5
В чем может быть причина использования преобразования квадратного корня в данных?
Есть ли причина того, что я могу придумать, чтобы преобразовать данные с квадратным корнем? Я имею в виду, что я всегда наблюдаю, что R ^ 2 увеличивается. Но это, вероятно, только из-за центрирования данных! Любая мысль ценится!

3
CDF поднят на власть?
Если - это CDF, похоже, что ( ) также является CDF.FZFZF_ZFZ(z)αFZ(z)αF_Z(z)^\alphaα>0α>0\alpha \gt 0 В: Это стандартный результат? Q: Есть ли хороший способ найти функцию с st , гдеgggX≡g(Z)X≡g(Z)X \equiv g(Z)FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alphax≡g(z)x≡g(z) x \equiv g(z) По сути, у меня есть еще один CDF, FZ(z)αFZ(z)αF_Z(z)^\alpha . В некотором смысле уменьшенной формы …

1
Преобразовать данные в желаемое среднее значение и стандартное отклонение
Я ищу метод для преобразования моего набора данных из его текущего среднего значения и стандартного отклонения в целевое среднее значение и целевое стандартное отклонение. По сути, я хочу уменьшить / расширить дисперсию и масштабировать все числа до среднего. Это не работает, чтобы сделать два отдельных линейных преобразования, одно для стандартного …

2
Преобразование данных: все переменные или только ненормальные?
В «Обнаружении статистики Энди Филда с использованием SPSS» он утверждает, что все переменные должны быть преобразованы. Однако в публикации: «Изучение пространственно меняющихся взаимосвязей между землепользованием и качеством воды с использованием географически взвешенной регрессии I: проектирование и оценка модели», в частности, они утверждают, что были преобразованы только ненормальные переменные. Этот анализ …

1
Как бороться со смесью двоичных и непрерывных входов в нейронных сетях?
Я использую пакет nnet в R, чтобы попытаться построить ANN для прогнозирования цен на недвижимость для квартир (личный проект). Я новичок в этом и не имею математического образования, поэтому, пожалуйста, держись со мной. У меня есть входные переменные, которые являются двоичными и непрерывными. Например, некоторые двоичные переменные, которые изначально были …


3
Как моделировать большие продольные данные?
Традиционно мы используем смешанную модель для моделирования продольных данных, то есть таких данных, как: id obs age treatment_lvl yield 1 0 11 M 0.2 1 1 11.5 M 0.5 1 2 12 L 0.6 2 0 17 H 1.2 2 1 18 M 0.9 мы можем предположить случайный перехват или …

1
Как энтропия зависит от местоположения и масштаба?
Энтропии непрерывного распределения с функцией плотности fff определяются как негатив ожидания log(f),log⁡(f),\log(f), и , следовательно , равны ЧАСе= - ∫∞- ∞журнал( ф( х ) ) е( х ) д х .Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Мы также говорим, что любая случайная величина ИксXX , распределение которой имеет плотность еff имеет …

3
центрирование и масштабирование фиктивных переменных
У меня есть набор данных, который содержит как категориальные переменные, так и непрерывные переменные. Мне посоветовали преобразовать категориальные переменные как двоичные переменные для каждого уровня (т. Е. A_level1: {0,1}, A_level2: {0,1}) - я думаю, некоторые назвали это «фиктивными переменными». С учетом вышесказанного, будет ли вводить в заблуждение центрирование и масштабирование …

3
Преобразование крайне искаженных распределений
Предположим, что у меня есть переменная, распределение которой искажено положительно в очень высокой степени, так что взятия бревна будет недостаточно, чтобы привести его в диапазон асимметрии для нормального распределения. Какие у меня варианты на данный момент? Что я могу сделать, чтобы преобразовать переменную в нормальное распределение?

4
Боксплотный эквивалент для дистрибутивов с тяжелыми хвостами?
Для приблизительно нормально распределенных данных коробочные диаграммы - отличный способ быстро визуализировать медиану и распространение данных, а также присутствие любых выбросов. Однако для распределений с более тяжелыми хвостами многие точки показаны как выбросы, поскольку выбросы определяются как находящиеся вне фиксированного коэффициента IQR, и это, конечно, происходит намного чаще с распределениями …

2
Var (X) известно, как рассчитать Var (1 / X)?
Если у меня есть только , как я могу вычислить ?V a r ( 1)Var(X)Var(X)\mathrm{Var}(X)Var(1X)Var(1X)\mathrm{Var}(\frac{1}{X}) У меня нет никакой информации о распределении , поэтому я не могу использовать преобразование, или любые другие методы , которые используют распределение вероятностей .XXXXXXX

3
Как рассчитать шкалу оценки Rousseeuw's и Croux '(1993) Qn для больших выборок?
Пусть поэтому для очень короткой выборки, такой как ее можно вычислить от нахождения статики го порядка парных разностей: Qn=Cn.{|Xi−Xj|;i&lt;j}(k)Qn=Cn.{|Xi−Xj|;i&lt;j}(k)Q_n = C_n.\{|X_i-X_j|;i < j\}_{(k)}{1,3,6,2,7,5}{1,3,6,2,7,5}\{1,3,6,2,7,5\}kkk 7 6 5 3 2 1 1 6 5 4 2 1 2 5 4 3 1 3 4 3 2 5 2 1 6 1 7 …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.