Вопросы с тегом «small-sample»

Относится к статистическим осложнениям или проблемам из-за недостатка данных. Если ваш вопрос касается небольшой выборки относительно количества переменных, используйте вместо этого тег [недоопределенный].

3
Bootstrap: проблема переоснащения
Предположим, что кто-то выполняет так называемый непараметрический бутстрап, рисуя выборок размером n каждая из исходных n наблюдений с заменой. Я полагаю, что эта процедура эквивалентна оценке кумулятивной функции распределения по эмпирическому cdf:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function и затем получение образцов начальной загрузки путем моделирования наблюдений из оцененных cdf B раз подряд.nnnBBB Если я …

7
Стоит ли моделировать короткие временные ряды?
Вот некоторый контекст. Я заинтересован в определении того, как две переменные среды (температура, уровни питательных веществ) влияют на среднее значение переменной отклика за 11-летний период. В течение каждого года есть данные из более чем 100 тысяч мест. Цель состоит в том, чтобы определить, отразилось ли в течение 11-летнего периода среднее …

4
Графические небольшие образцы
У меня есть небольшой набор данных 14 раз для выполнения задачи. Однако у меня возникают трудности с поиском подходящего графика для использования в графике данных. Если бы образец был больше, я бы использовал коробочную диаграмму или гистограмму, но я не уверен, что было бы целесообразно использовать в этом случае, когда …

1
Последовательность Халтона против последовательности Соболя?
Из ответа на предыдущий вопрос я был направлен на последовательность Халтона для создания набора векторов, которые покрывали равномерное пространство выборки довольно равномерно. Но страница в Википедии упоминает, что более высокие простые числа часто очень сильно коррелируют в начале ряда. Это, кажется, имеет место для любой пары старших чисел с относительно …

2
Подходит ли Random Forest для очень маленьких наборов данных?
У меня есть набор данных, состоящий из 24 строк ежемесячных данных. Особенности ВВП, прибытие в аэропорт, месяц и некоторые другие. Зависимой переменной является количество посетителей популярного туристического направления. Подойдет ли Random Forest для такой проблемы? Данные не являются общедоступными, поэтому я не могу опубликовать образец.

1
ANOVA: тестирование предположения о нормальности для многих групп с небольшим количеством образцов на группу
Предположим следующую ситуацию: у нас есть большое количество (например, 20) с небольшим размером группы (например, n = 3). Я заметил, что если я сгенерирую значения из равномерного распределения, остатки будут выглядеть примерно нормально, даже если распределение ошибок будет равномерным. Следующий код R демонстрирует это поведение: n.group = 200 n.per.group = …

1
тесты противтестов?
Я пытаюсь выяснить, в чем именно разница между тестами и тестами.TttZzz Насколько я могу судить, для обоих классов тестов используется одна и та же статистика тестов, что-то вроде б^- Ссеˆ( б^)б^-Ссе^(б^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} где - некоторая выборочная статистика, - некоторая ссылочная константа (местоположение) (которая зависит от деталей теста), а - …

2
Надежна ли рандомизация с небольшими выборками?
Джером Корнфилд написал: Одним из лучших плодов фишерианской революции была идея рандомизации, и статистики, согласившиеся с несколькими другими моментами, по крайней мере согласились с этим. Но, несмотря на это согласие и несмотря на широкое использование процедур рандомизированного распределения в клинических и других формах экспериментов, его логический статус, то есть точная …

3
Пределы основанных на деревьях методов ансамбля в маленьких n, больших p проблемах?
Основанные на деревьях методы ансамбля, такие как Случайный лес и последующие производные (например, условный лес), предназначены для использования в так называемых задачах «маленький n , большой p » для определения относительной важности переменной. Действительно, похоже, что это так, но мой вопрос в том, как далеко может быть взята эта способность? …

1
Регрессия с очень маленьким размером выборки
Я хочу провести регрессию с 4-5 пояснительными переменными, но у меня есть только 15 наблюдений. Не имея возможности предположить, что эти переменные нормально распределены, существует ли непараметрический или какой-либо другой действительный метод регрессии?
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.