Вопросы с тегом «python»

Python - это язык программирования, обычно используемый для машинного обучения. Используйте этот тег для любого * по теме * вопроса, который (a) включает `Python` в качестве критической части вопроса или ожидаемого ответа, и (b) не * просто * о том, как использовать` Python`.

6
Ресурсы для изучения того, как реализовать методы ансамбля
Я теоретически (вроде) понимаю, как они будут работать, но не уверен, как на самом деле использовать метод ансамбля (такой как голосование, взвешенные смеси и т. Д.). Каковы хорошие ресурсы для реализации методов ансамбля? Существуют ли какие-либо конкретные ресурсы относительно реализации в Python? РЕДАКТИРОВАТЬ: Чтобы прояснить некоторые из них, основываясь на …

3
Рубин как верстак статистики
Это также вопрос, который в значительной степени относится к Python как инструменту статистики и превосходит его как инструмент статистики . Я знаю, что существует большая дискуссия о Ruby против Python, но это не главное в этом вопросе. Я подумал, что Ruby быстрее Python и обладает очень естественным синтаксисом, может помочь …
13 r  python  software  ruby 

4
Существуют ли учебные пособия по Байесовской теории вероятностей или графические модели на примере?
Я видел ссылки на изучение байесовской теории вероятностей в R, и мне было интересно, есть ли еще что-то подобное, возможно, конкретно в Python? Направлены на изучение байесовской теории вероятностей, умозаключений, оценки максимального правдоподобия, графических моделей и тому подобного?

9
Улучшенные деревья решений в python? [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос так, чтобы он был по теме перекрестной проверки. Закрыто 5 месяцев назад . Есть ли хорошая библиотека Python для обучения расширенных деревьев решений?
13 python  cart  boosting 

1
Пакет GBM против Карет с использованием GBM
Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в качестве метрики оценки. Я хочу найти оптимальную производительность …

2
Использование BIC для оценки количества k в KMEANS
В настоящее время я пытаюсь вычислить BIC для моего игрушечного набора данных (ofc iris (:). Я хочу воспроизвести результаты, как показано здесь (Рис. 5). Этот документ также является моим источником для формул BIC. У меня есть 2 проблемы с этим: Обозначения: ninin_i я = количество элементов в кластереiii CiCiC_i я …

2
Как использовать фильтр Калмана?
У меня есть траектория объекта в 2D-пространстве (поверхности). Траектория задается в виде последовательности (x,y)координат. Я знаю, что мои измерения шумят, и иногда у меня есть очевидные выбросы. Итак, я хочу отфильтровать свои наблюдения. Насколько я понял фильтр Калмана, он делает именно то, что мне нужно. Итак, я пытаюсь использовать это. …

4
Как (систематически) настроить скорость обучения с использованием градиентного спуска в качестве оптимизатора?
Посторонний в поле ML / DL; начал курс Udacity Deep Learning, основанный на Tensorflow; выполняя задание 3, задача 4; пытаясь настроить скорость обучения с помощью следующего конфига: Размер партии 128 Количество шагов: достаточно, чтобы заполнить 2 эпохи Размеры скрытых слоев: 1024, 305, 75 Инициализация веса: усеченный в норме с помощью …

1
Порядковый логистический регресс в Python
Я хотел бы запустить порядковую логистическую регрессию в Python - для переменной ответа с тремя уровнями и несколькими объяснительными факторами. statsmodelsПакет поддерживает двоичный логит и модель полиномиального логита (MNLogit), но не упорядоченную логит. Поскольку основополагающая математика не так уж отличается, мне интересно, может ли она быть легко реализована с помощью …

1
Как интерпретировать автокорреляционный график в MCMC
Я знакомлюсь с байесовской статистикой, читая книгу Джона К. Крушке « Анализ байесовских данных» , также известную как «книга щенков». В главе 9 иерархические модели представлены на этом простом примере: и наблюдения Бернулли составляют 3 монеты, каждая из которых состоит из 10 сальто. Один показывает 9 голов, другой 5 голов, …

5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Почему это распределение равномерно?
Мы изучаем байесовское статистическое тестирование и сталкиваемся со странным (по крайней мере, мне) явлением. Рассмотрим следующий случай: мы заинтересованы в измерении того, какая популяция, A или B, имеет более высокий коэффициент конверсии. Для проверки мы устанавливаем , то есть вероятность конверсии одинакова в обеих группах. Мы генерируем искусственные данные, используя …

1
Пакеты Python для работы с моделями гауссовых смесей (GMM)
Кажется, есть несколько вариантов для работы с моделями гауссовых смесей (GMM) в Python. На первый взгляд есть как минимум: PyMix - http://www.pymix.org/pymix/index.php Инструменты для моделирования смесей PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/, которая является частью набора инструментов Scipy и, кажется, фокусируется на обновлении GMM : теперь известно как sklearn.mixture . PyPR - http://pypr.sourceforge.net/ …

1
Интерпретация выходных данных Scikitвести
Я работаю с библиотекой Scikit-Learn в Python. В приведенном ниже коде я предсказываю вероятность, но я не знаю, как прочитать вывод. Данные тестирования from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]]) y = np.array([0,1,1,0,1,2]) Разделить набор данных X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, test_size=0.5, …

2
Можно ли оценить GLM в Python / scikit-learn, используя распределения Пуассона, Гаммы или Твиди как семейство для распределения ошибок?
Пытаюсь выучить немного Python и Sklearn, но для своей работы мне нужно запустить регрессии, которые используют распределения ошибок из семейств Пуассона, Гаммы и особенно семейства Твиди. Я ничего не вижу в документации о них, но они есть в нескольких частях дистрибутива R, поэтому мне было интересно, видел ли кто-нибудь где-нибудь …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.