Вопросы с тегом «computational-statistics»

Относится к интерфейсу статистики и вычислений; использование алгоритмов и программного обеспечения в статистических целях.

21
Есть ли у Юлии надежда остаться в статистическом сообществе?
Я недавно прочитал сообщение от R-Bloggers, которое связывалось с этим сообщением в блоге от Джона Майлса Уайта о новом языке под названием Джулия . Джулия пользуется преимуществом компилятора, работающего точно в срок, который дает ему быстрое время выполнения и ставит его на тот же порядок скорости, что и C / …

9
Какой алгоритм я должен использовать для обнаружения аномалий на временных рядах?
Фон Я работаю в Центре сетевых операций, мы отслеживаем компьютерные системы и их производительность. Одним из ключевых показателей для мониторинга является количество посетителей \ клиентов, которые в настоящее время подключены к нашим серверам. Чтобы сделать это видимым, мы (команда Ops) собираем такие метрики, как данные временных рядов и рисуем графики. …

8
Excel как инструмент для статистики
Похоже, что многие люди (в том числе и я) любят проводить предварительный анализ данных в Excel. Некоторые ограничения, такие как количество строк, разрешенных в электронной таблице, являются проблемой, но в большинстве случаев не делают невозможным использование Excel для работы с данными. Тем не менее, статья МакКаллоу и Хайзера практически кричит …


7
Статистическая концепция, объясняющая, почему у вас меньше шансов перевернуть то же количество голов, что и у хвостов, так как количество переворотов увеличивается?
Я работаю над изучением вероятности и статистики, прочитав несколько книг и написав некоторый код, и, моделируя броски монет, я заметил нечто, что показалось мне слегка противоречащим наивной интуиции. Если вы подбрасываете чистую монету раз, соотношение голов и хвостов сходится к 1 при увеличении , как и следовало ожидать. Но с …

12
Инструмент командной строки для расчета базовой статистики для потока значений [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Существует ли какой-либо инструмент командной строки, который принимает поток чисел (в формате ascii) из стандартного ввода и предоставляет основную описательную …

4
Каковы правильные значения для точности и отзыва в крайних случаях?
Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю статистический …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
Как подобрать дискретное распределение для подсчета данных?
У меня есть следующая гистограмма данных подсчета. И я хотел бы приспособить к этому дискретное распределение. Я не уверен, как я должен идти об этом. Должен ли я сначала наложить на гистограмму дискретное распределение, скажем, отрицательное биномиальное распределение, чтобы получить параметры дискретного распределения, а затем выполнить тест Колмогорова – Смирнова …

2
Каковы некоторые важные применения генерации случайных чисел в вычислительной статистике?
Как и почему генераторы случайных чисел (ГСЧ) важны в вычислительной статистике? Я понимаю, что случайность важна при выборе выборок для многих статистических тестов, чтобы избежать смещения в отношении любой гипотезы, но есть ли другие области вычислительной статистики, где важны генераторы случайных чисел?

1
Как стохастический градиентный спуск может сэкономить время по сравнению со стандартным градиентным спуском?
Стандартный градиентный спуск будет вычислять градиент для всего набора обучающих данных. for i in range(nb_epochs): params_grad = evaluate_gradient(loss_function, data, params) params = params - learning_rate * params_grad Для заранее определенного числа эпох мы сначала вычисляем вектор градиента weights_grad функции потерь для всего набора данных с нашими параметрами вектора параметров. Stochastic …

2
Чем ABC и MCMC отличаются в своих приложениях?
Насколько я понимаю, приблизительные байесовские вычисления (ABC) и цепь Маркова Монте-Карло (MCMC) имеют очень похожие цели. Ниже я опишу свое понимание этих методов и то, как я воспринимаю различия в их применении к реальным данным. Приближенное байесовское вычисление ABC состоит из выборки параметра θθ\theta из предшествующего, посредством численного моделирования вычисляют …

3
Используют ли некоторые из вас электронную таблицу Документов Google, чтобы вести статистическую работу и делиться ею с другими?
Я знаю, что большинство из вас, вероятно, считают, что Документы Google по-прежнему являются примитивным инструментом. Это не Matlab или R и даже не Excel. Тем не менее, я сбит с толку мощью этого веб-программного обеспечения, которое просто использует возможности браузера (и совместимо со многими браузерами, которые работают совсем по-другому). Майк …

9
Какие книги предоставляют обзор вычислительной статистики в применении к информатике?
Как инженер-программист, меня интересуют такие темы, как статистические алгоритмы, интеллектуальный анализ данных, машинное обучение, байесовские сети, алгоритмы классификации, нейронные сети, цепочки Маркова, методы Монте-Карло и генерация случайных чисел. Лично мне не доставляло удовольствия работать на практике с любым из этих методов, но мне приходилось работать с программным обеспечением, которое под …

4
Эффективное обновление линейной регрессии при добавлении наблюдений и / или предикторов в R
Мне было бы интересно найти пути в R для эффективного обновления линейной модели при добавлении наблюдения или предиктора. У biglm есть возможность обновления при добавлении наблюдений, но мои данные достаточно малы, чтобы находиться в памяти (хотя у меня есть большое количество экземпляров для обновления). Есть способы сделать это голыми руками, …

1
Какой метод множественного сравнения использовать для модели lmer: lsmeans или glht?
Я анализирую набор данных, используя модель смешанных эффектов с одним фиксированным эффектом (условием) и двумя случайными эффектами (участник из-за дизайна объекта и пары). Модель была сгенерирована с lme4пакетом: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Затем я выполнил тест отношения правдоподобия этой модели по сравнению с моделью без фиксированного эффекта (условия) и получил значительную разницу. В …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.