Насколько я понимаю, мы не должны позволять тому же набору данных, который мы анализируем, управлять / определять, как выглядят предыдущие распределения в байесовском анализе. В частности, неуместно определять предыдущие распределения для байесовского анализа, основанные на сводной статистике из того же набора данных, который вы затем будете использовать приоры, чтобы помочь вписать модель.
Кто-нибудь знает о ресурсах, которые конкретно обсуждают это как неуместное? Мне нужны цитаты по этому вопросу.