Вопросы с тегом «discrete-data»

Относится к данным, сгенерированным из распределения, имеющего счетное пространство выборок. Метка дискретных данных может охватывать категориальные данные, будь то номинальные (например, распределение расы в выборке людей) или порядковые (например, социально-экономический статус), или фактические дискретные случайные вариации, такие как набор счетчиков событий (например, количество ошибок на странице текста). Однако дискретные данные не обязательно должны быть целочисленными.

2
Как называется это дискретное распределение (рекурсивное разностное уравнение), которое я получил?
Я наткнулся на этот дистрибутив в компьютерной игре и хотел узнать больше о ее поведении. Это связано с решением относительно того, должно ли происходить определенное событие после определенного количества действий игрока. Подробности за этим не имеют значения. Это кажется применимым к другим ситуациям, и я нашел это интересным, потому что …

1
Определение оптимальной дискретизации данных из непрерывного распределения
Предположим, у вас есть набор данных из непрерывного распределения с плотностью поддерживаемой на которая неизвестна, но довольно велико, поэтому плотность ядра (например) оценка, , довольно точна. Для конкретного приложения мне нужно преобразовать наблюдаемые данные в конечное число категорий, чтобы получить новый набор данных с подразумеваемой функцией массы .Y1,...,YnY1,...,YnY_{1}, ..., Y_{n}p(y)p(y)p(y)[0,1][0,1][0,1]nnnp^(y)p^(y)\hat{p}(y)Z1,...,ZnZ1,...,ZnZ_{1}, …

1
Как проверить, являются ли мои данные дискретными или непрерывными?
Мне кажется, что для выбора правильных статистических инструментов я должен сначала определить, является ли мой набор данных дискретным или непрерывным. Не могли бы вы научить меня, как я могу проверить, являются ли данные дискретными или непрерывными с помощью R?

2
Распределение по отсортированным спискам
Скажем, у нас есть упорядоченный список товаров [a, b, c, ... x, y, z, ...] Я ищу семейство дистрибутивов с поддержкой в ​​списке выше, управляемых некоторым параметром альфа, чтобы: При альфа = 0 он присваивает вероятность 1 первому элементу, a выше, а 0 остальным. То есть, если мы сделаем выборку …

4
Меняется ли распределение вероятности урны, когда вы извлекаете ее без замены в среднем?
Предположим, у меня есть урна, содержащая N различных цветов шаров, и каждый другой цвет может появляться разное количество раз (если есть 10 красных шаров, то также не обязательно должно быть 10 синих шаров). Если мы знаем точное содержимое урны до рисования, мы можем сформировать дискретное распределение вероятностей, которое сообщает нам …

1
Как найти и оценить оптимальную дискретизацию для непрерывной переменной с критерием
У меня есть набор данных с непрерывной переменной и двоичной целевой переменной (0 и 1). Мне нужно дискретизировать непрерывные переменные (для логистической регрессии) по отношению к целевой переменной и с ограничением, что частота наблюдений в каждом интервале должна быть сбалансирована. Я пробовал алгоритмы машинного обучения, такие как Chi Merge, деревья …

1
Дискретные данные и альтернативы PCA
У меня есть набор данных с дискретными (порядковыми, меристическими и номинальными) переменными, описывающими морфологические признаки крыла нескольких близкородственных видов насекомых. То, что я хочу сделать, - это провести какой-то анализ, который бы дал мне визуальное представление о сходстве разных видов на основе морфологических характеристик. Первой вещью, которая пришла мне в …

2
Распределения на подмножествах
Мне интересно, есть ли какие-либо стандартные распределения на подмножествах целых чисел . Эквивалентно, мы могли бы выразить это как распределение по вектору длины двоичных результатов, например, если то соответствует вектору .{1,2,...,J}{1,2,...,J}\{1, 2, ..., J\}JJJJ=5J=5J = 5{1,3,5}{1,3,5}\{1, 3, 5\}(1,0,1,0,1)(1,0,1,0,1)(1, 0, 1, 0, 1) В идеале я ищу некое распределение , происходящее …

1
Дискретные функции: доверительный интервал покрытия?
Как рассчитать покрытие дискретного интервала? Что я умею делать: Если бы у меня была непрерывная модель, я мог бы определить 95% доверительный интервал для каждого из моих прогнозируемых значений, а затем посмотреть, как часто фактические значения были в пределах доверительного интервала. Я мог бы обнаружить, что только в 88% случаев …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.