Вопросы с тегом «inference»

Делать выводы о параметрах населения из выборочных данных. См. Https://en.wikipedia.org/wiki/Inference и https://en.wikipedia.org/wiki/Statistical_inference

4
Как интерпретировать сюжет QQ
Я работаю с небольшим набором данных (21 наблюдение) и имею следующий нормальный график QQ в R: Видя, что сюжет не поддерживает нормальность, что я могу сделать вывод о базовом распределении? Мне кажется, что распределение, более искаженное вправо, было бы лучше, верно? Кроме того, какие еще выводы мы можем сделать из …

12
Кто такие байесовцы?
Когда кто-то начинает интересоваться статистикой, дихотомия «Частый» и «Байесовский» вскоре становится обычным явлением (а кто вообще не читал « Сигнал и шум» Нейта Сильвера ?). В беседах и вводных курсах точка зрения является чрезвычайно частой ( MLE , значения), но есть небольшая часть времени, посвященная восхищению формулой Байеса и касанием …

10
Понимание «дисперсии» интуитивно
Какой самый простой и понятный способ объяснить кому-либо понятие дисперсии? Что это означает интуитивно? Если кто-то должен объяснить это своему ребенку, как он поступит? Это концепция, которую мне сложно сформулировать, особенно когда она связана с риском. Я понимаю это математически и тоже могу объяснить это. Но когда вы объясняете явления …

8
Что является хорошим, убедительным примером, в котором p-значения полезны?
Мой вопрос в названии говорит сам за себя, но я хотел бы дать ему некоторый контекст. Ранее на этой неделе ASA опубликовала заявление « о p-значениях: контекст, процесс и цель », в котором изложены различные распространенные заблуждения о p-значении и содержится настоятельная рекомендация не использовать его без контекста и обдумывания …

12
Двухсторонние тесты ... Я просто не уверен. В чем смысл?
Следующий отрывок из записи: В чем различия между односторонним и двусторонним тестами? , на сайте помощи статистики UCLA. ... рассмотреть последствия пропуска эффекта в другом направлении. Представьте, что вы разработали новый препарат, который, по вашему мнению, является улучшением по сравнению с существующим препаратом. Вы хотите максимизировать свою способность обнаруживать улучшение, …

7
Почему кто-то использует байесовский подход с «неинформативным» неподобающим предшествующим вместо классического подхода?
Если интерес представляет собой просто оценка параметров модели (точечная и / или интервальная оценка) и предшествующая информация не является надежной, слабой (я знаю, что это немного расплывчато, но я пытаюсь создать сценарий, в котором выбор до этого сложно) ... Почему кто-то решил использовать байесовский подход с «неинформативными» неподходящими априорными вместо …

3
Проверка равенства коэффициентов двух разных регрессий
Это кажется основной проблемой, но я только что понял, что на самом деле не знаю, как проверить равенство коэффициентов двух разных регрессий. Может кто-нибудь пролить некоторый свет на это? Более формально, предположим, что я запустил следующие две регрессии: и где относится к матрице проектирования регрессии , а к вектору коэффициентов …

6
Эмпирическое правило для количества образцов начальной загрузки
Интересно, знает ли кто-нибудь какие-либо общие практические правила относительно количества выборок начальной загрузки, которые следует использовать, основываясь на характеристиках данных (количество наблюдений и т. Д.) И / или включенных переменных?

4
Что такое основной аргумент и почему он не был принят?
Одним из поздних вкладов Р.А. Фишера были опорные интервалы и опорные принципиальные аргументы . Этот подход, однако, далеко не так популярен, как частые или байесовские принципиальные аргументы. Что такое опорный аргумент и почему он не был принят?

3
Почему базовое тестирование гипотез фокусируется на среднем, а не на медиане?
На базовых курсах по статистике для студентов (обычно?) Обучают проверке гипотез для среднего населения. Почему основное внимание уделяется среднему значению, а не срединному значению? Я предполагаю, что из-за центральной предельной теоремы легче проверить среднее значение, но я бы хотел прочитать некоторые обоснованные объяснения.

2
Выполнение статистического теста после визуализации данных - выемка данных?
Я предложу этот вопрос на примере. Предположим, у меня есть набор данных, такой как набор данных по ценам на жилье в Бостоне, в котором у меня есть непрерывные и категориальные переменные. Здесь у нас есть переменная «качество», от 1 до 10, и цена продажи. Я могу разделить данные на дома …

3
Приспосабливая укоренившиеся представления значений p
Иногда в отчеты я включаю заявление об отказе от p-значений и другую логическую статистику, которую я предоставил. Я говорю, что, поскольку выборка не была случайной, такая статистика не будет строго применяться. Моя конкретная формулировка обычно приводится в сноске: «В то время как, строго говоря, логическая статистика применима только в контексте …

7
Вывод против оценки?
Каковы различия между «выводом» и «оценкой» в контексте машинного обучения ? Как новичок, я чувствую , что мы заключаем случайные величины и оценку параметров модели. Правильно ли это понимание? Если нет, то какие именно различия, и когда я должен использовать какие? Кроме того, какой из них является синонимом «учиться»?

5
Как работать с иерархическими / вложенными данными в машинном обучении
Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

3
Что если ваша случайная выборка явно не репрезентативна?
Что делать, если вы берете случайную выборку и видите, что она явно не репрезентативна, как в недавнем вопросе . Например, что, если предполагается, что распределение населения симметрично относительно 0, а выборка, которую вы выбираете случайным образом, имеет несбалансированные положительные и отрицательные наблюдения, а разбаланс является статистически значимым, что вас оставляет? …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.