Если ваш основной интерес - это двумерные задачи, я бы сказал, что оценка плотности ядра - хороший выбор, поскольку она обладает хорошими асимптотическими свойствами (обратите внимание, что я не говорю, что она лучшая). Смотри например
Parzen E. (1962). Об оценке функции и моды плотности вероятности . Анналы математической статистики 33: 1065–1076.
де Вальпин, П. (2004). Пространственные вероятности состояния Монте-Карло путем взвешенной апостериорной оценки плотности ядра . Журнал Американской статистической ассоциации 99: 523-536.
Для более высоких измерений (4+) этот метод действительно медленный из-за известной трудности в оценке матрицы оптимальной полосы пропускания, см .
Теперь проблема с командой ks
в пакете KDE
состоит в том, что, как вы упомянули, она оценивает плотность в конкретной сетке, что может быть очень ограничивающим. Эта проблема может быть решена, если вы используете пакет KDE
для оценки матрицы пропускной способности, например Hscv
, реализуете оценщик плотности ядра и затем оптимизируете эту функцию с помощью команды optim
. Это показано ниже с использованием смоделированных данных и гауссова ядра в R
.
rm(list=ls())
# Required packages
library(mvtnorm)
library(ks)
# simulated data
set.seed(1)
dat = rmvnorm(1000,c(0,0),diag(2))
# Bandwidth matrix
H.scv=Hlscv(dat)
# [Implementation of the KDE](http://en.wikipedia.org/wiki/Kernel_density_estimation)
H.eig = eigen(H.scv)
H.sqrt = H.eig$vectors %*% diag(sqrt(H.eig$values)) %*% solve(H.eig$vectors)
H = solve(H.sqrt)
dH = det(H.scv)
Gkde = function(par){
return( -log(mean(dmvnorm(t(H%*%t(par-dat)),rep(0,2),diag(2),log=FALSE)/sqrt(dH))))
}
# Optimisation
Max = optim(c(0,0),Gkde)$par
Max
Оценки с ограниченной формой, как правило, быстрее, например
Cule, ML, Samworth, RJ и Stewart, MI (2010). Оценка максимального правдоподобия многомерной лог-вогнутой плотности . Журнал Королевского статистического общества B 72: 545–600.
Но они слишком пики для этой цели.
4
Другие методы, которые вы можете рассмотреть с помощью: подгонка многомерной конечной смеси нормалей (или других гибких распределений) или
Abraham, C., Biau, G. и Cadre, B. (2003). Простая оценка режима многомерной плотности . Канадский журнал статистики 31: 23–34.
Надеюсь, это поможет.