В течение прошлого года я довольно тесно работал над выборкой важных данных, и у меня есть несколько открытых вопросов, с которыми я надеялся получить некоторую помощь.
Мой практический опыт работы со схемами выборки по важности заключался в том, что они могут иногда давать фантастические оценки с низким отклонением и смещением. Однако чаще они, как правило, дают оценки с высокой ошибкой, которые имеют низкую дисперсию выборки, но очень высокую погрешность.
Мне интересно, может ли кто-нибудь объяснить, какие именно факторы влияют на достоверность выборочных оценок важности? В частности мне интересно:
1) Гарантируются ли оценки выборки важности к правильному результату, когда распределение смещения имеет ту же поддержку, что и исходное распределение? Если так, то почему на практике это занимает так много времени?
2) Существует ли количественная связь между ошибкой в оценке, полученной в результате выборки по важности, и "качеством" распределения смещения (т. Е. Насколько оно соответствует распределению с нулевой дисперсией)
3) Частично основанный на 1) и 2) - есть ли способ количественно определить, «сколько» вы должны знать о распределении, прежде чем вам лучше будет использовать выборочный анализ важности, чем простой метод Монте-Карло.