Оценка плотности ядра по асимметричным распределениям


10

Пусть - наблюдения, полученные из неизвестного (но, безусловно, асимметричного) распределения вероятностей.{x1,,xN}

Я хотел бы найти распределение вероятностей с помощью KDE Однако я попытался использовать ядро ​​Гаусса, но оно работало плохо, поскольку оно симметрично. Таким образом, я видел, что были выпущены некоторые работы с ядрами Gamma и Beta, хотя я не понимал, как с ними работать.

f^(x)=1Nhi=1NK(xxih)

Мой вопрос: как справиться с этим асимметричным случаем, предположив, что поддержка базового распределения не находится в интервале ?[0,1]


4
В случае плотностей, близких к логнормальным (с которыми я часто сталкиваюсь в некоторых конкретных приложениях), я просто преобразую (беря логи) и затем делаю KDE, а затем преобразую KDE обратно (вам необходимо помнить о якобиане при преобразовании оценка обратно). Это работает довольно хорошо в этом случае.
Glen_b

@Glen_b есть ли у вас какие-либо ссылки или материалы, где описан этот метод? (Расчет KDE на преобразование исходной переменной, а затем преобразование KDE обратно)
boscovich

Не то, чтобы я знал - я уверен, что они существуют, так как это довольно тривиальная идея, и ее легко реализовать. Это та вещь, которую я ожидал бы получить от старшекурсника. На практике это работает очень хорошо.
Glen_b

@glen_b спасибо. Так что, если бы я использовал его в техническом отчете / публикации, как вы думаете, было бы нормально не давать никаких ссылок?
Boscovich

1
@guy Конечно, могут быть проблемы, особенно с некоторыми преобразованиями и некоторыми видами данных. Ситуации, которые я использовал, имеют тенденцию быть довольно близкими к логнормальным, и изменение полосы пропускания, которое вы видите как проблему, именно то, что нужно; это делает намного лучше, чем KDE на необработанных данных. Из описания ОП это звучало довольно похоже, но я не думаю, что это была панацея .
Glen_b

Ответы:


5

Прежде всего, KDE с симметричными ядрами также может очень хорошо работать, когда ваши данные асимметричны. В противном случае, на практике это было бы совершенно бесполезно.

log(x)


Если вы изменяете масштаб log(x), вам также нужно учитывать якобиан?
DilithiumMatrix

0

Хм. Вы могли бы хотеть, чтобы ширина ядра изменилась как функция местоположения.

Если бы я смотрел на проблему в eCDF, то я мог бы попытаться связать числовой наклон CDF с размером ядра.

Я думаю, что если вы собираетесь выполнить преобразование координат, вам нужно иметь довольно хорошее представление о начальной и конечной точках. Если вы хорошо знаете распределение целей, то вам не нужно приближение ядра.


1
Я мог бы очень легко знать, что мои RVs неотрицательны, но все еще хотят KDE.
парень
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.