Как сказал Карл Броман в своем ответе, байесовский подход, вероятно, будет намного лучше, чем использование доверительных интервалов.
Проблема с доверительными интервалами
Почему использование доверительных интервалов может не сработать? Одна из причин заключается в том, что если у вас мало оценок для элемента, тогда ваш доверительный интервал будет очень широким, поэтому нижняя граница доверительного интервала будет небольшой. Таким образом, товары без большого количества оценок окажутся в нижней части вашего списка.
Интуитивно, однако, вы, вероятно, хотите, чтобы элементы без большого количества оценок были близки к среднему элементу, поэтому вы хотите покачивать свой оценочный рейтинг этого элемента в сторону среднего рейтинга по всем элементам (то есть вы хотите подтолкнуть свой предполагаемый рейтинг к предыдущему ). , Это именно то, что делает байесовский подход.
Байесовский подход I: нормальное распределение по рейтингам
Один из способов приблизить оценочный рейтинг к предыдущему, как в ответе Карла, использовать оценку в виде :w∗R+(1−w)∗C
- R - среднее значение по рейтингам предметов.
- C - это среднее значение по всем пунктам (или тому, перед чем вы хотите уменьшить свой рейтинг).
- Обратите внимание , что формула является лишь взвешенной комбинацией и .RC
- w=vv+m - это вес, присвоенный , где - количество отзывов о пиве, а - некоторый постоянный «пороговый» параметр.Rvm
- Обратите внимание , что при очень велико, то есть, когда у нас есть много оценки для текущего элемента, то очень близко к 1, так что наш рейтинг по оценкам очень близка к , и мы обращаем мало внимания на предшествующем уровне . Когда мала, однако, очень близко к 0, поэтому расчетная оценка ставит много веса на предшествующем уровне .vwRCvwC
Эта оценка может фактически быть дана байесовской интерпретацией как апостериорная оценка средней оценки элемента, когда индивидуальные оценки получены из нормального распределения, сосредоточенного вокруг этого среднего значения.
Тем не менее, если предположить, что рейтинги исходят из нормального распределения, есть две проблемы:
- Нормальное распределение непрерывно , но рейтинги дискретны .
- Оценки для предмета не обязательно соответствуют унимодальной гауссовой форме. Например, возможно, ваш предмет очень поляризован, поэтому люди склонны либо давать ему очень высокий рейтинг, либо очень низкий рейтинг.
Байесовский подход II: мультиномиальное распределение по рейтингам
Поэтому вместо того, чтобы предполагать нормальное распределение рейтингов, давайте предположим, что распределение многочленов . То есть, учитывая некоторый конкретный элемент, есть вероятность что случайный пользователь даст ему 1 звезду, вероятность что случайный пользователь даст ему 2 звезды, и так далее.p1p2
Конечно, мы понятия не имеем, что это за вероятности. Поскольку мы получаем все больше и больше оценок для этого элемента, мы можем догадаться, что близко к , где - это количество пользователей, которые дали ему 1 звезду, а - общее количество пользователей, которые оценили предмет, но когда мы только начинаем, у нас ничего нет. Таким образом, мы помещаем Dirichlet prior в эти вероятности.p1n1nn1n Dir(α1,…,αk)
Что это за дирихле приор? Мы можем рассматривать каждый параметр как «виртуальный счетчик» числа раз, когда какой-то виртуальный человек давал элемент, звездочкой. Например, если , и все остальные равны 0, то мы можем думать об этом как о том, что два виртуальных человека дали звезду элемента 1, а один виртуальный человек дал элемент 2 звезды. Поэтому, прежде чем мы получим реальных пользователей, мы можем использовать этот виртуальный дистрибутив для оценки рейтинга элемента.αiiα1=2α2=1αi
[Одним из способов выбора параметров было бы установить равным общей доле голосов звезд. (Обратите внимание, что параметры не обязательно являются целыми числами.)]α i i α iαiαiiαi
Затем, как только появятся реальные рейтинги, просто добавьте их к виртуальным счетам вашего Dirichlet. Всякий раз, когда вы хотите оценить рейтинг вашего элемента, просто возьмите среднее значение по всем рейтингам элемента (как его виртуальные оценки, так и его фактические оценки).