Вопросы с тегом «python»

Python - это язык программирования, обычно используемый для машинного обучения. Используйте этот тег для любого * по теме * вопроса, который (a) включает `Python` в качестве критической части вопроса или ожидаемого ответа, и (b) не * просто * о том, как использовать` Python`.

2
Как использовать функции перекрестной проверки scikit-learn в классификаторах с несколькими метками
Я тестирую разные классификаторы на наборе данных, где есть 5 классов, и каждый экземпляр может принадлежать одному или нескольким из этих классов, поэтому я использую, в частности, многокомпонентные классификаторы scikit-learn sklearn.multiclass.OneVsRestClassifier. Теперь я хочу выполнить перекрестную проверку с помощью sklearn.cross_validation.StratifiedKFold. Это приводит к следующей ошибке: Traceback (most recent call last): …

2
Как назвать тики в бокс-поте python matplotlib
Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Python matplotlib имеет команду boxplot . Обычно все части графика имеют числовые отметки. Как я могу поменять галочки на названия вместо позиций? …

4
Каковы правильные значения для точности и отзыва в крайних случаях?
Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю статистический …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
Кластеризация корреляционной матрицы
У меня есть корреляционная матрица, в которой указано, как каждый элемент соотносится с другим элементом. Следовательно, для N элементов у меня уже есть N * N корреляционная матрица. Используя эту корреляционную матрицу, как кластеризовать N элементов в M бинах, чтобы я мог сказать, что Nk элементов в k-ом бине ведут …

1
Использование круговых предикторов в линейной регрессии
Я пытаюсь подобрать модель, используя данные о ветре (0, 359) и время суток (0, 23), но я обеспокоен тем, что они плохо вписываются в линейную регрессию, поскольку сами по себе они не являются линейными параметрами. Я хотел бы преобразовать их с помощью Python. Я видел некоторые упоминания о вычислении среднего …

3
Юлия: Подводя итоги, как дела
Этот пост относится к быстро меняющемуся событию. Я столкнулся с вопросом 2012 года, в котором было очень хорошее обсуждение Джулии как альтернативы R / Python для различных типов статистических работ. Здесь лежит оригинальный вопрос 2012 года об обещании Юлии К сожалению, тогда Юлия была очень новичком, а наборы инструментов, необходимые …
19 r  python  computing  julia 

3
Использование RNN (LSTM) для прогнозирования векторов временных рядов (Theano)
У меня очень простая проблема, но я не могу найти правильный инструмент для ее решения. У меня есть некоторая последовательность векторов одинаковой длины. Теперь я хотел бы обучить LSTM RNN на выборке из этих последовательностей, а затем сделать это для предсказания новой последовательности векторов длины на основе нескольких векторов праймирования …

3
Как моделировать данные, чтобы они были статистически значимыми?
Я учусь в 10 классе и собираюсь смоделировать данные для проекта ярмарки машинного обучения. Окончательная модель будет использоваться на данных пациента и будет предсказывать корреляцию между определенным временем недели и влиянием, которое это оказывает на приверженность к лечению в данных одного пациента. Значения приверженности будут двоичными (0 означает, что они …

3
Как вычислить стандартные ошибки коэффициентов логистической регрессии
Я использую Python Scikit-Learn для обучения и проверки логистической регрессии. scikit-learn возвращает коэффициенты регрессии независимых переменных, но не предоставляет стандартных ошибок коэффициентов. Мне нужны эти стандартные ошибки для вычисления статистики Вальда для каждого коэффициента и, в свою очередь, для сравнения этих коэффициентов друг с другом. Я нашел одно описание того, …

3
Как систематически удалять коллинеарные переменные в Python? [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . До сих пор я удалял коллинеарные переменные как часть процесса подготовки данных, просматривая корреляционные таблицы и удаляя переменные, которые …

3
Как я могу моделировать сальто до N успехов?
Мы с тобой решили сыграть в игру, в которой мы по очереди подбрасываем монету. Первый игрок, который перевернет 10 голов, выигрывает игру. Естественно, есть спор о том, кто должен идти первым. Моделирование этой игры показывает, что игрок, который переворачивает первый, выигрывает на 6% больше, чем игрок, который переворачивает второй (первый …


2
Можно ли автоматизировать прогнозирование временных рядов?
Я хотел бы построить алгоритм, который мог бы анализировать любые временные ряды и «автоматически» выбирать лучший традиционный / статистический метод прогнозирования (и его параметры) для анализируемых данных временных рядов. Было бы возможно сделать что-то подобное? Если да, можете ли вы дать мне несколько советов о том, как это можно сделать?

1
Jenks Natural Breaks в Python: как найти оптимальное количество перерывов?
Я нашел эту реализацию Python в Дженкс Natural Breaks алгоритма , и я мог бы сделать его запустить на моем компьютере Windows 7. Это довольно быстро, и он находит разрывы за короткое время, учитывая размер моих геоданных. Прежде чем использовать этот алгоритм кластеризации для моих данных, я использовал sklearn.clustering.KMeans (здесь) …

1
В множественной линейной регрессии, почему график предсказанных точек не лежит на прямой линии?
Я использую множественную линейную регрессию для описания отношений между Y и X1, X2. Из теории я понял, что множественная регрессия предполагает линейные отношения между Y и каждым из X (Y и X1, Y и X2). Я не использую какие-либо преобразования X. Итак, я получил модель с R = 0,45 и …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.