Есть ли статистический тест, который является параметрическим и непараметрическим? Этот вопрос был задан группой интервью. Это правильный вопрос?
Есть ли статистический тест, который является параметрическим и непараметрическим? Этот вопрос был задан группой интервью. Это правильный вопрос?
Ответы:
Принципиально сложно точно сказать, что подразумевается под «параметрическим тестом» и «непараметрическим тестом», хотя существует множество конкретных примеров, в которых большинство согласится с тем, является ли тест параметрическим или непараметрическим (но никогда не бывает и тем, и другим). , Быстрый поиск дал эту таблицу , которая, как мне кажется, представляет собой общее практическое различие в некоторых областях между параметрическими и непараметрическими тестами.
Прямо над упомянутой таблицей есть замечание:
«... параметрические данные имеют нормальное нормальное распределение .... все остальное непараметрическое».
В некоторых областях может быть принятым критерием, что либо мы принимаем нормальность и используем ANOVA, и это параметрический, либо мы не предполагаем нормальность и не используем непараметрические альтернативы.
Возможно, это не очень хорошее определение, и, на мой взгляд, оно не совсем правильное, но это может быть практическое правило. Главным образом потому, что конечной целью в социальных науках, скажем, является анализ данных, и что хорошего в том, чтобы иметь возможность формулировать параметрическую модель на основе ненормального распределения и затем не иметь возможности анализировать данные?
Альтернативное определение состоит в том, чтобы определить «непараметрические тесты» как тесты, которые не полагаются на предположения о распределении и параметрические тесты, как что-либо еще.
Первое, а также второе приведенное определение определяют один класс тестов, а затем определяют другой класс как дополнение (все остальное). По определению это исключает, что тест может быть как параметрическим, так и непараметрическим.
Правда в том, что последнее определение также проблематично. Что если существуют определенные естественные «непараметрические» предположения, такие как симметрия, которые могут быть навязаны? Превратит ли это тестовую статистику, которая в противном случае не полагается на какие-либо предположения о распределении, в параметрический тест? Большинство скажет нет!
Следовательно, в классе непараметрических тестов есть тесты, которым разрешено делать некоторые предположения о распределении при условии, что они не являются «слишком параметрическими». Граница между «параметрическими» и «непараметрическими» тестами стала размытой, но я полагаю, что большинство будет придерживаться того, что либо тест является параметрическим, либо непараметрическим, возможно, это может быть ни одно, а утверждение, что он имеет мало смысла.
С другой точки зрения, многие параметрические тесты являются (эквивалентными) тестами отношения правдоподобия. Это делает возможной общую теорию, и у нас есть единое понимание распределительных свойств тестов отношения правдоподобия при подходящих условиях регулярности. Непараметрические тесты, напротив, не эквивалентны тестам отношения правдоподобия как таковым нет вероятности - и без объединяющей методологии, основанной на вероятности, мы должны получать результаты распределения в каждом конкретном случае. Теория эмпирического правдоподобияРазработанный в основном Арт Оуэном в Стэнфорде, это очень интересный компромисс. Он предлагает основанный на вероятности подход к статистике (для меня это важный момент, так как я рассматриваю вероятность как более важный объект, чем , скажем, значение) без необходимости типичных параметрических предположений о распределении. Фундаментальная идея - умное использование многочленного распределения на эмпирических данных, методы очень «параметрические», но действительные без ограничения параметрических допущений.
Тесты, основанные на эмпирическом правдоподобии, имеют, IMHO, достоинства параметрических тестов и универсальность непараметрических тестов, поэтому среди тестов, которые я могу себе представить, они ближе всего подходят для квалификации как параметрических, так и непараметрических, хотя я бы Не используйте эту терминологию.
Параметрический используется в (как минимум) двух значениях: A - чтобы объявить, что вы принимаете семейство распределения шума вплоть до его параметров. B - Чтобы заявить, что вы предполагаете конкретные функциональные отношения между объясняющими переменными и результатом.
Несколько примеров:
Термин «полупараметрический» обычно относится к случаю B и означает, что вы не принимаете полное функциональное отношение, а скорее имеете более мягкие предположения, такие как «аддитивность в некотором плавном преобразовании предикторов».
Вы также можете иметь более мягкие предположения о распределении шума, такие как «все моменты конечны», без конкретного указания формы распределения. Насколько мне известно, нет термина для этого типа предположения.
Обратите внимание, что ответ связан с базовыми предположениями, лежащими в основе процесса генерации данных. Говоря «a-параметрический тест», обычно подразумевают непараметрический в смысле A. В этом вы и имели в виду то, что я отвечал «нет». Было бы невозможно быть параметрическим и непараметрическим в одном и том же смысле одновременно.
Я полагаю, это зависит от того, что они подразумевают под «параметрическим и непараметрическим»? В то же время точно оба, или смесь двух?
Многие считают, что модель пропорциональных рисков Кокса является полупараметрической, поскольку она не дает параметрической оценки базовой опасности.
Или вы можете просмотреть многие непараметрические статистические данные как массивно-параметрические.
Брэдли в своих классических статистических тестах без распределения (1968, стр. 15–16 - см. Этот вопрос для цитаты) разъясняет разницу между тестами без распределения и непараметрическими , которые, по его словам, часто связаны друг с другом, и дает Пример параметрического критерия без распределения в качестве критерия знака для медианы. В этом тесте не делается никаких предположений о базовом распределении выборочной совокупности значений переменных, поэтому он не распространяется . Однако, если выбранная медиана верна, значения выше и ниже ее следует выбирать с равной вероятностью, проверяя случайные выборки из
Обновить