Вопросы с тегом «discrete-data»

Относится к данным, сгенерированным из распределения, имеющего счетное пространство выборок. Метка дискретных данных может охватывать категориальные данные, будь то номинальные (например, распределение расы в выборке людей) или порядковые (например, социально-экономический статус), или фактические дискретные случайные вариации, такие как набор счетчиков событий (например, количество ошибок на странице текста). Однако дискретные данные не обязательно должны быть целочисленными.


5
Кластеризация набора данных с дискретными и непрерывными переменными
У меня есть набор данных X, который имеет 10 измерений, 4 из которых являются дискретными значениями. Фактически, эти 4 дискретные переменные являются порядковыми, то есть более высокое значение подразумевает более высокую / лучшую семантику. 2 из этих дискретных переменных являются категориальными в том смысле, что для каждой из этих переменных …

3
Справедлив ли критерий Колмогорова-Смирнова с дискретными распределениями?
Я сравниваю пример и проверяю, распространяется ли он как какой-то дискретный дистрибутив. Однако я не уверен, что Колмогоров-Смирнов подает заявку. Википедия, кажется, подразумевает, что это не так. Если это не так, как я могу проверить распределение образца?

4
Прогнозирование с использованием как непрерывных, так и категориальных функций
Некоторые методы прогнозирующего моделирования больше предназначены для обработки непрерывных предикторов, а другие - для обработки категориальных или дискретных переменных. Конечно, существуют методы преобразования одного типа в другой (дискретизация, фиктивные переменные и т. Д.). Однако существуют ли какие-либо методы прогнозного моделирования, которые предназначены для одновременной обработки обоих типов ввода без простой …

1
Колмогоров-Смирнов с дискретными данными: Как правильно использовать dgof :: ks.test в R?
Вопросы для начинающих: Я хочу проверить, поступают ли два дискретных набора данных из одного распределения. Мне предложили пробу Колмогорова-Смирнова. Коновер ( Практическая непараметрическая статистика , 3d), кажется, говорит, что для этой цели можно использовать тест Колмогорова-Смирнова, но его поведение «консервативно» с дискретными распределениями, и я не уверен, что это значит …

1
Отбрасывание одного из столбцов при использовании быстрого кодирования
Насколько я понимаю, в машинном обучении может возникнуть проблема, если ваш набор данных имеет сильно коррелированные функции, поскольку они эффективно кодируют одну и ту же информацию. Недавно кто-то указал, что когда вы выполняете однократное кодирование для категориальной переменной, вы получаете коррелированные функции, поэтому вы должны отбросить одну из них в …

2
У этого дискретного распределения есть имя?
У этого дискретного распределения есть имя? Для i∈1...Ni∈1...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} Я наткнулся на этот дистрибутив из следующего: У меня есть список из элементов, ранжированных по какой-либо служебной функции. Я хочу случайным образом выбрать один из элементов, смещаясь к началу списка. Итак, сначала я …

2
Обнаружение аномалий с фиктивными характеристиками (и другими дискретными / категориальными характеристиками)
ТЛ; др Каков рекомендуемый способ обработки discreteданных при обнаружении аномалий? Каков рекомендуемый способ обработки categoricalданных при обнаружении аномалий? Этот ответ предлагает использовать дискретные данные для фильтрации результатов. Возможно, замените значение категории шансом наблюдения перктата? вступление Это моя первая публикация здесь, поэтому, пожалуйста, если что-то не кажется технически правильным, ни в …

1
Основные вопросы об анализе выживания в дискретном времени
Я пытаюсь провести анализ выживания с дискретным временем, используя модель логистической регрессии, и я не уверен, что полностью понимаю процесс. Я был бы очень признателен за помощь с несколькими основными вопросами. Вот установка: Я смотрю на членство в группе в течение пятилетнего периода времени. Каждый участник имеет ежемесячную запись членства …

2
Как подобрать дискретное распределение для подсчета данных?
У меня есть следующая гистограмма данных подсчета. И я хотел бы приспособить к этому дискретное распределение. Я не уверен, как я должен идти об этом. Должен ли я сначала наложить на гистограмму дискретное распределение, скажем, отрицательное биномиальное распределение, чтобы получить параметры дискретного распределения, а затем выполнить тест Колмогорова – Смирнова …

1
Гамильтониан Монте-Карло и пространства с дискретными параметрами
Я только начал строить модели в Стэн ; Чтобы познакомиться с этим инструментом, я прорабатываю некоторые из упражнений в Байесовском анализе данных (2-е изд.). В Waterbuck упражнение предполагает , что данные , с ( N , & thetas ; ) неизвестной. Поскольку гамильтониан Монте-Карло не допускает дискретных параметров, я объявил …

3
Формула вероятности для многомерного распределения Бернулли
Мне нужна формула для вероятности события в n-вариативном распределении Бернулли X∈{0,1}nX∈{0,1}nX\in\{0,1\}^n с заданными вероятностями P(Xi=1)=piP(Xi=1)=piP(X_i=1)=p_i для одного элемента и для пар элементов P(Xi=1∧Xj=1)=pijP(Xi=1∧Xj=1)=pijP(X_i=1 \wedge X_j=1)=p_{ij} . Эквивалентное я мог бы дать среднее значение и ковариация XXX . Я уже узнал, что существует много распределений, имеющих свойства, так же как существует …

3
Свойства дискретной случайной величины
Мой курс статистики только что научил меня, что дискретная случайная величина имеет конечное число опций ... Я этого не осознавал. Я бы подумал, как набор целых чисел, это может быть бесконечным. Поиск и проверка нескольких веб-страниц, в том числе нескольких из университетских курсов, не смогли конкретно подтвердить это; однако большинство …

3
Визуализировать двумерное биномиальное распределение
Вопрос: как выглядит двумерное биномиальное распределение в трехмерном пространстве? Ниже приведена конкретная функция, которую я хотел бы визуализировать для различных значений параметров; а именно , и .nnnp1p1p_{1}p2p2p_{2} f(x1,x2)=n!x1!x2!px11px22,x1+x2=n,p1+p2=1.f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.f(x_{1},x_{2}) = \frac{n!}{x_{1}!x_{2}!}p_{1}^{x_{1}}p_{2}^{x_{2}}, \qquad x_{1}+x_{2}=n, \quad p_{1}+p_{2}=1. Обратите внимание, что есть два ограничения; и . Кроме того, является положительным целым числом, скажем, .x1+x2=nx1+x2=nx_{1}+x_{2}=nn …

2
Оптимальное биннинг по отношению к заданной переменной отклика
Я ищу оптимальный метод биннинга (дискретизации) непрерывной переменной по отношению к заданной ответной (целевой) двоичной переменной и с максимальным количеством интервалов в качестве параметра. пример: у меня есть набор наблюдений за людьми с переменными "высота" (цифра непрерывная) и "has_back_pains" (бинарная). Я хочу разделить высоту на 3 интервала (группы) не более, …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.