Вопросы с тегом «statistics»

Подумайте, не лучше ли задать ваш вопрос на https://stats.stackexchange.com. Статистика - это математическое исследование использования вероятности для вывода характеристик населения из ограниченного числа выборок или наблюдений.

12
Множественная линейная регрессия в Python
Кажется, я не могу найти библиотеки Python, которые выполняют множественную регрессию. Единственное, что я нахожу, - это простая регрессия. Мне нужно регрессировать мою зависимую переменную (y) по нескольким независимым переменным (x1, x2, x3 и т. Д.). Например, с этими данными: print 'y x1 x2 x3 x4 x5 x6 x7' for …


18
Статистика: комбинации в Python
Мне нужно вычислить combinatorials (NCR) в Python , но не может найти функцию , чтобы сделать это в math, numpyили stat библиотеках. Что-то вроде функции типа: comb = calculate_combinations(n, r) Мне нужно количество возможных комбинаций, а не фактические комбинации, поэтому itertools.combinationsменя это не интересует. Наконец, я хочу избежать использования факториалов, …

12
Алгоритм скользящей медианы в C
В настоящее время я работаю над алгоритмом для реализации скользящего медианного фильтра (аналогичного фильтру скользящего среднего) в C. Из моего поиска в литературе, похоже, есть два достаточно эффективных способа сделать это. Первый - отсортировать начальное окно значений, затем выполнить двоичный поиск, чтобы вставить новое значение и удалить существующее на каждой …
114 c  algorithm  r  statistics  median 

4
Вычислить доверительный интервал из выборочных данных
У меня есть образцы данных, для которых я хотел бы вычислить доверительный интервал, предполагая нормальное распределение. Я нашел и установил пакеты numpy и scipy и получил numpy для возврата среднего и стандартного отклонения (numpy.mean (data) с данными в виде списка). Мы будем очень благодарны за любые советы по получению выборочного …

9
Среднее геометрическое: есть ли встроенный?
Я пытался найти встроенную функцию для среднего геометрического, но не смог. (Очевидно, что встроенный модуль не спасет меня в любое время при работе в оболочке, и я не подозреваю, что есть какая-либо разница в точности; для скриптов я стараюсь использовать встроенные модули как можно чаще, где (совокупный) прирост производительности часто …

6
Статистика браузера по JavaScript отключена [закрыто]
Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 3 года назад . Уточните этот вопрос Мне сложно собирать общедоступную статистику о проценте веб-пользователей, которые просматривают с отключенным JavaScript. …

5
Как использовать функцию «развертки»
Когда я смотрю на исходный код пакетов R, я вижу, что функция sweepиспользуется довольно часто. Иногда он используется, когда было бы достаточно более простой функции (например, apply), в других случаях невозможно точно знать, что он делает, не потратив достаточное количество времени на пошаговое выполнение блока кода, в котором оно находится. …
101 r  statistics 


11
Как удалить выбросы из набора данных
У меня есть многомерные данные о красоте и возрастах. Возраст варьируется от 20 до 40 с интервалом 2 (20, 22, 24 .... 40), и для каждой записи данных им дается возраст и оценка красоты от 1 до 5. Когда я строю прямоугольные диаграммы этих данных (возраст по оси X, оценки …
98 r  statistics  outliers 

4
Таблица частот для одной переменной
Последний вопрос новичков, панд на день: как мне создать таблицу для одной серии? Например: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } Много поисков в Google привело меня к Series.describe () и pandas.crosstabs, но ни один из них не делает …

6
Почему в покере с гибким планированием используется серия Фибоначчи? [закрыто]
Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 6 лет назад . Уточните этот вопрос При оценке относительного размера пользовательских историй при гибкой разработке программного обеспечения члены команды …

8
Python быстрее и легче C ++? [закрыто]
В настоящее время этот вопрос не подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, потребует дебатов, аргументов, опросов или расширенного обсуждения. Если вы считаете, что этот вопрос можно улучшить и, возможно, снова открыть, обратитесь за помощью …

11
Как рассчитать r-квадрат с помощью Python и Numpy?
Я использую Python и Numpy для вычисления наиболее подходящего полинома произвольной степени. Я передаю список значений x, значений y и степени полинома, который мне нужен (линейный, квадратичный и т. Д.). Это много работает, но я также хочу вычислить r (коэффициент корреляции) и r-квадрат (коэффициент детерминации). Я сравниваю свои результаты с …

13
Какую статистику коммитов Git легко получить
Раньше мне нравилась способность TortoiseSvn генерировать простую статистику фиксации для заданного репозитория SVN. Мне интересно, что доступно в Git, и меня особенно интересуют: Количество коммитов на пользователя Количество строк, измененных на пользователя активность во времени (например, агрегированные еженедельные изменения) Любые идеи?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.