Вопросы с тегом «python»

Python - это язык программирования, обычно используемый для машинного обучения. Используйте этот тег для любого * по теме * вопроса, который (a) включает `Python` в качестве критической части вопроса или ожидаемого ответа, и (b) не * просто * о том, как использовать` Python`.

2
Реализация вложенной перекрестной проверки
Я пытаюсь выяснить, правильно ли мое понимание вложенной перекрестной проверки, поэтому я написал этот игрушечный пример, чтобы проверить, прав ли я: import operator import numpy as np from sklearn import cross_validation from sklearn import ensemble from sklearn.datasets import load_boston # set random state state = 1 # load boston dataset …

3
Обнаружение аномалий временных рядов с помощью Python
Мне нужно реализовать обнаружение аномалий в нескольких наборах данных временных рядов. Я никогда не делал этого раньше и надеялся на некоторые советы. Я очень хорошо разбираюсь в python, поэтому я бы предпочел, чтобы в нем было реализовано решение (большая часть моего кода - это python для других частей моей работы). …

1
R линейная регрессия категориальной переменной «скрытое» значение
Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод, заданный R, будет выглядеть примерно …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


1
Как детям удается объединить своих родителей в прогнозе PCA набора данных GWAS?
Возьмите 20 случайных точек в 10000-мерном пространстве с каждой координатой из N( 0 , 1 )N(0,1)\mathcal N(0,1) . Разделите их на 10 пар («пары») и добавьте среднее значение каждой пары («ребенок») к набору данных. Затем проведите PCA по полученным 30 точкам и постройте график PC1 против PC2. Происходит замечательная вещь: …

1
Генерация случайных чисел из «наклонного равномерного распределения» из математической теории
Для каких-то целей мне нужно генерировать случайные числа (данные) из распределения "наклонной формы". «Наклон» этого распределения может изменяться в некотором разумном интервале, и тогда мое распределение должно измениться с равномерного на треугольное в зависимости от наклона. Вот мой вывод: Давайте сделаем это просто и сгенерируем данные от до (синий, красный …

2
Как бы вы визуализировали сегментированную воронку? (а вы могли бы сделать это с Python?)
Я видел этот пост на Moz, который представил сегментированную маркетинговую воронку: Такие вещи будут иметь большую ценность в моей работе. Я понятия не имею, как визуализировать необработанные данные, чтобы показать сегментированную воронку, подобную этой. Идея состоит в том, что коммерческие предложения поступают из разных источников (которые мы используем для сегментирования …

1
Формула формулы инерции в скиките учиться
Я хотел бы закодировать кластеризацию kmeans в python, используя pandas и scikit learn. Чтобы выбрать хороший k, я хотел бы закодировать статистику разрыва из Tibshirani и др. 2001 ( pdf ). Я хотел бы знать, могу ли я использовать результат inertia_ от scikit и адаптировать формулу статистики разрыва без необходимости …

2
Как подогнать регрессию типа
У меня есть данные временного ряда, где измеряемая переменная представляет собой дискретные положительные целые числа (числа). Я хочу проверить, есть ли тенденция со временем (или нет). Независимая переменная (x) находится в диапазоне 0-500, а зависимая переменная (y) находится в диапазоне 0-8. Я думал, что я отвечу на это, подгоняя регрессию …
9 r  regression  python 

2
Оценка пиков во временных рядах данных сигнала ячейки
Я измеряю наличие ответа в измерениях сигнала клетки. Сначала я применил алгоритм сглаживания (Hanning) к временным рядам данных, а затем обнаружил пики. Что я получаю, это: Если бы я хотел сделать обнаружение ответа более объективным, чем «да, вы видите повышение в непрерывном падении», какой подход был бы лучшим? Это чтобы …

5
Расчет процентиля нормального распределения
Смотрите эту страницу Википедии: http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Agresti-Coull_Interval Чтобы получить интервал Agresti-Coull, нужно вычислить процентиль нормального распределения, называемого zZz . Как рассчитать процентиль? Есть ли готовая функция, которая делает это в Wolfram Mathematica и / или Python / NumPy / SciPy?

1
Разница между наивными байесовскими и рекуррентными нейронными сетями (LSTM)
Я хочу провести анализ настроений над текстом, прочитал несколько статей, некоторые из них используют «Наивный байесовский», а другие - «Рекуррентную нейронную сеть (LSTM)» , с другой стороны, я видел библиотеку python для анализа настроений, которая это нлтк. Он использует "Наивный байесовский", может кто-нибудь объяснить, в чем разница между этими двумя? …

2
Почему этот набор данных не имеет ковариации?
Мое понимание того, как работает ковариация, заключается в том, что коррелированные данные должны иметь несколько высокую ковариацию. Я сталкивался с ситуацией, когда мои данные выглядят коррелированными (как показано на диаграмме рассеяния), но ковариация близка к нулю. Как ковариация данных может быть нулевой, если они коррелированы? import numpy as np x1 …

1
Как провести корреляционный анализ пива и подгузников
У меня есть данные, которые эквивалентны: shopper_1 = ['beer', 'eggs', 'water',...] shopper_2 = ['diapers', 'beer',...] ... Я хотел бы провести некоторый анализ этого набора данных, чтобы получить корреляционную матрицу, которая имела бы значение, аналогичное следующему: если вы купили x, вы, вероятно, купите y. Используя python (или что-нибудь еще, кроме MATLAB), …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.