Вопросы с тегом «terminology»

Использование и значение конкретных технических слов / понятий в статистике.

1
В чем разница между «нагрузками» и «корреляционными нагрузками» в PCA и PLS?
При анализе основных компонентов (PCA) обычно нужно распределить две нагрузки друг на друга, чтобы исследовать отношения между переменными. В документе, сопровождающем пакет PLS R для выполнения регрессии главных компонентов и регрессии PLS, есть другой график, называемый графиком корреляционных нагрузок (см. Рисунок 7 и страницу 15 в документе). Корреляция нагрузки , …

2
«Либеральные» р-значения?
Мой вопрос довольно семантический. Когда метод обычно выдает высокие значения p, он называется консервативным. Вы бы назвали обратное, то есть метод с высоким уровнем ошибок типа II либеральным?

2
Почему лемма Неймана-Пирсона является леммой, а не теоремой?
Это больше вопрос истории, чем технический вопрос. Почему лемма Неймана-Пирсона является леммой, а не теоремой? ссылка на вики: https://en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma NB : Вопрос не в том, что такое лемма и как леммы используются для доказательства теоремы, а в истории леммы Неймана-Пирсона. Использовалось ли это для доказательства теоремы, а потом оказалось более …

4
Строго говоря, «случайная проекция» не является проекцией?
Текущие реализации алгоритма случайного Проекционного уменьшить размерность выборок данных путем сопоставления их с к с использованием проекции матрицы , элементы которой являются IID из подходящего распределения (например , из ):рdRd\mathbb R^dRkRk\mathbb R^kd×kd×kd\times kRRRN(0,1)N(0,1)\mathcal N(0,1) x′=1k√xRx′=1kxRx^\prime = \frac{1}{\sqrt k}xR Удобно, что существуют теоретические доказательства, показывающие, что это отображение приблизительно сохраняет попарные …

6
Как называется «горячая» кодировка в научной литературе?
Как называется оператор, который берет категориальный вектор и преобразует его в двоичное представление, используя горячее кодирование? Я задаюсь вопросом, так как я пишу научную статью и нужное имя для этого.

4
Что именно подразумевается под «набором данных»?
Это просто совокупность точек данных? Или это представление точек данных для разных элементов в табличном формате, упорядоченных по значениям разных переменных? Чем он отличается от необработанных данных?

2
Является ли смещение свойством оценщика или конкретных оценок?
В качестве примера я часто встречаю студентов, которые знают, что Observed является предвзятой оценкой численности населения R 2 . Затем, при написании своих отчетов, они говорят что-то вроде:р2р2R^2R2R2R^2 «Я рассчитал Observed и Скорректированный R 2 , и они были довольно похожи, предполагая лишь небольшое смещение в полученном нами значении Observed …

1
Кумулянт высшего порядка и имена моментов вне дисперсии, асимметрии и эксцесса
В физике или математической механике, начиная с временной позиции , можно получить скорости изменения через производные по времени: скорость, ускорение, рывок (3-й порядок), скачок (4-й порядок).x(t)x(t)x(t) Некоторые уже предложили оснастку, треск, треск для производных вплоть до седьмого порядка. Моменты, вдохновленные механической физикой и теорией упругости, также важны в статистике, см. …

3
Откуда появился термин «выучить модель»
Часто я слышал, что майнеры данных используют этот термин. Как статистик, который работал над проблемами классификации, я знаком с термином «обучить классификатора», и я предполагаю, что «выучить модель» означает то же самое. Я не против термина «обучить классификатора». Кажется, это изображает идею подгонки модели, поскольку данные обучения используются для получения …

1
Является ли стандартизированные остатки v / s стандартизированных остатков в модели ЛМ
Являются ли «изученные остатки» и «стандартизированные остатки» одинаковыми в регрессионных моделях? Я построил модель линейной регрессии в R и хотел построить график Studentized Остатки v / s, подобранные значения, но не нашел автоматизированный способ сделать это в R. Предположим, у меня есть модель library(MASS) lm.fit <- lm(Boston$medv~(Boston$lstat)) затем использование plot(lm.fit)не …


3
Является ли вычисление «фактической вероятности покрытия» таким же, как вычисление «вероятного интервала»?
Я читал учебник по статистике начального уровня. В главе, посвященной оценке максимального правдоподобия доли успеха в данных с биномиальным распределением, он дал формулу для расчета доверительного интервала, а затем упомянул небрежно Рассмотрим его фактическую вероятность покрытия, то есть вероятность того, что метод создает интервал, который фиксирует истинное значение параметра. Это …


2
Разброс отклонения: термин для ожидаемой квадратической ошибки прогноза за вычетом неснижаемой ошибки
Hastie et al. «Элементы статистического обучения» (2009) рассматривают процесс генерирования данных с E ( ε ) = 0 и Var ( ε ) = σ 2 ε .Y= ф( Х) + εY=f(X)+ε Y = f(X) + \varepsilon E(ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var(ε)=σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} Они представляют следующее разностное разложение ожидаемой квадратной ошибки прогноза в точке (стр. …

1
В чем разница между многообразным обучением и нелинейным уменьшением размерности?
В чем разница между многообразным обучением и нелинейным уменьшением размерности ? Я видел эти два термина взаимозаменяемо. Например: http://www.cs.cornell.edu/~kilian/research/manifold/manifold.html : Изучение многообразия (часто также называемое нелинейным уменьшением размерности) преследует цель встраивать данные, которые изначально лежат в многомерном пространстве, в низкоразмерное пространство, сохраняя при этом характерные свойства. http://www.stat.washington.edu/courses/stat539/spring14/Resources/tutorial_nonlin-dim-red.pdf : В этом …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.