Приносим свои извинения за убийство статистического языка :). Я нашел здесь пару вопросов, связанных с рекламой и рейтингом кликов. Но никто из них не очень помог мне с моим пониманием моей иерархической ситуации.
Есть связанный вопрос Являются ли эти эквивалентные представления одной и той же иерархической байесовской модели? , но я не уверен, есть ли у них похожая проблема. Другой вопрос Приоры для иерархической байесовской биномиальной модели подробно описывают гиперприоры, но я не могу сопоставить их решение с моей проблемой.
У меня есть пара объявлений в Интернете для нового продукта. Я позволил рекламе показываться в течение нескольких дней. В этот момент достаточно людей нажали на рекламу, чтобы увидеть, какой из них получает больше всего кликов. После того, как я выбил все, кроме того, у которого больше всего кликов, я позволил этому запустить еще пару дней, чтобы посмотреть, сколько людей на самом деле покупают после нажатия на объявление. В этот момент я знаю, было ли хорошей идеей показывать рекламу в первую очередь.
Моя статистика очень шумная, потому что у меня не так много данных, потому что я продаю только пару вещей каждый день. Поэтому очень сложно оценить, сколько людей покупают что-то после просмотра рекламы. Только один из каждых 150 кликов приводит к покупке.
Вообще говоря, мне нужно знать, теряю ли я деньги на каждом объявлении, как можно скорее, как-то сглаживая статистику по каждой группе объявлений с глобальной статистикой по всем объявлениям.
- Если я подожду, пока в каждом объявлении не появится достаточно покупок, я разорюсь, потому что это занимает слишком много времени: при тестировании 10 объявлений мне нужно потратить в 10 раз больше денег, чтобы статистика по каждому объявлению была достаточно надежной. К тому времени я мог потерять деньги.
- Если я усредню покупки по всем объявлениям, я не смогу выбросить рекламу, которая просто не работает.
Могу ли я использовать глобальную скорость покупки ( N $ суб-распределения? Это означает, что чем больше у меня данных по каждому объявлению, тем более независимой становится статистика для этого объявления. Если никто еще не нажал на объявление, я предполагаю, что глобальное среднее значение подходит.
Какой дистрибутив я бы выбрал для этого?
Если у меня было 20 нажатий на A и 4 нажатия на B, как я могу смоделировать это? До сих пор я выяснил, что здесь может иметь смысл биномиальное или пуассоновское распределение:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(оцените стоимость покупки только для группы А?)
Но что мне делать дальше, чтобы на самом деле рассчитать purchase_rate | group A
. Как соединить два распределения вместе, чтобы иметь смысл для группы А (или любой другой группы).
Я должен сначала соответствовать модели? У меня есть данные, которые я мог бы использовать для «обучения» модели:
- Объявление А: 352 клика, 5 покупок
- Объявление B: 15 кликов, 0 покупок
- Объявление C: 3519 кликов, 130 покупок
Я ищу способ оценить вероятность любой из групп. Если у группы есть только пара точек данных, я, по сути, хочу вернуться к среднему мировому значению. Я немного разбираюсь в байесовской статистике и читал множество PDF-файлов людей, описывающих, как они моделируют, используя байесовский вывод, сопряженные априорные числа и так далее. Я думаю, что есть способ сделать это правильно, но я не могу понять, как правильно его смоделировать.
Я был бы очень рад намекам, которые помогают мне сформулировать мою проблему в байесовской манере. Это очень помогло бы найти примеры в Интернете, которые я мог бы использовать, чтобы фактически реализовать это.
Обновить:
Большое спасибо за ответ. Я начинаю понимать все больше и больше маленьких о моей проблеме. Спасибо! Позвольте мне задать несколько вопросов, чтобы понять, немного ли я понимаю проблему сейчас:
Поэтому я предполагаю, что преобразования распределены как бета-распределения, а бета-распределение имеет два параметра, и b .
1 параметра являются гиперпараметрами, поэтому они являются параметрами к предыдущему? Итак, в конце концов, я установил количество конверсий и количество кликов в качестве параметра моего бета-распределения?
Затем я умножаю с априором, который является P (преобразование), что в моем случае является просто априором Джеффриса, который неинформативен. Будет ли предыдущий оставаться таким же, как я получаю больше данных?
Используя предыдущую версию Джеффриса, я предполагаю, что я начинаю с нуля и ничего не знаю о своих данных. Этот априор называется «неинформативным». Как я продолжаю изучать свои данные, обновляю ли я предыдущие?
Когда приходят клики и конверсии, я прочитал, что должен «обновить» свой дистрибутив. Значит ли это, что параметры моего дистрибутива меняются, или что предыдущие изменяются? Когда я получу клик по объявлению X, могу ли я обновить несколько дистрибутивов? Больше чем один предыдущий?