Резюме моего ответа. Мне нравится моделирование цепей Маркова, но оно пропускает «временной» аспект. С другой стороны, фокусировка на временном аспекте (например, на среднем времени в ) пропускает аспект «перехода». Я хотел бы перейти к следующему общему моделированию (которое с подходящим допущением может привести к [процессу Маркова] [1]). Также есть много «цензурированных» статистических данных, стоящих за этой проблемой (что, безусловно, является классической проблемой надежности программного обеспечения?). Последнее уравнение моего ответа дает оценку максимального правдоподобия интенсивности голосования (с «+» и «до» с «-») для данного состояния голосования. Как мы можем видеть из уравнения, он является промежуточным по отношению к случаю, когда вы оцениваете только вероятность перехода, и к случаю, когда вы измеряете только время, проведенное в данном состоянии. Надеюсь, это поможет.−1
Общее моделирование (для повторения вопроса и предположений).
Пусть и будут случайными переменными, моделирующими соответственно даты голосования и соответствующий знак голосования (+1 для повышения, -1 для снижения). Процесс голосования просто ( S i ) i ≥ 1(VDi)i≥1(Si)i≥1
Yt=Y+t−Y−t
где
Y+t=∑i=0∞1VDi≤t,Si=1 and Y−t=∑i=0∞1VDi≤t,Si=−1
Важное значение здесь имеет намерение -jump
где может быть или а - хорошая фильтрация, в общем случае, без других знаний это было бы :
.ϵ
λϵt=limdt→01dtP(Yϵt+dt−Yϵt=1|Ft)
ϵ−+FtFt=σ(Y+t,Y−t,VD1,…,VDY+t+Y−t,S1,…,SY+t+Y−t)
но в соответствии с вашим вопросом, я думаю, вы неявно предполагаете, что
Это означает, что для существует детерминированная последовательность такой, что .
P(Yϵt+dt−Yϵt=1|Ft)=P(Yϵt+dt−Yϵt=1|Yt)
ϵ=+,−(μϵi)i∈Zλϵt=μϵYt
В рамках этого формализма ваш вопрос можно переформулировать так: «вполне вероятно, что » (или, по крайней мере, разница больше, чем заданный порог).μ+−1−μ+0>0
В этом предположении легко показать, что является [однородным марковским процессом] [3] на с генератором заданным какYtZQ
∀i,j∈ZQi,i+1=μ+iQi,i−1=μ−iQii=1−(μ+i+μ−i)Qij=0 if |i−j|>1
Отвечая на вопрос (предлагая оценку максимального правдоподобия для статистической задачи)
Из этой переформулировки решение проблемы осуществляется путем оценки и построения теста с учетом его значений. Давайте исправим и забудем индекс без потери общности. Оценка (и ) может быть выполнена после наблюдения(μ+i)iμ+μ−
(T1,η1),…,(Tp,ηp) где - длины из периодов, проведенных в состоянии (то есть последовательные времена с ) и равно если за вопрос проголосовали отрицательно, если за него проголосовали, и если это было последнее состояние наблюдения.TjjthpiYt=iηj+1−10
Если вы забудете случай с последним состоянием наблюдения, упомянутые пары будут взяты из распределения, которое зависит от и : оно распространяется как (где Exp - это случайная переменная из экспоненциального распределения, а равно + или -1 в зависимости от того, кто реализует максимум). Затем вы можете использовать следующую простую лемму (доказательство простое):μ+iμ−i(min(Exp(μ+i),Exp(μ−i)),η)η
Лемма Если и то и . X+⇝Exp(μ+)X−⇝Exp(μ−)T=min(X+,X−)⇝Exp(μ++μ−)P(X+1<X−)=μ+μ++μ−
Это означает, что плотность of определяется как:
где для - это функция плотности экспоненциальной случайной величины с параметром . Из этого выражения легко вывести оценку максимального правдоподобия и :f(t,ϵ)(T,η)
f(t,ϵ)=gμ++μ−(1(ϵ=+1)∗μ++1(ϵ=−1)∗μ−μ++μ−)
gaa>0aμ+μ−
(μ^+,μ^−)=argminln(μ−+μ+)((μ−+μ+)∑i=1pTi+p)−p−ln(μ−)−p+ln(μ+)
гдеи,
p−=|i:δi=−1|p+=|i:δi=+1|
Комментарии для более продвинутых подходов
Если вы хотите принять во внимание случаи, когда - последнее наблюдаемое состояние (конечно, умнее, потому что когда вы проходите через , это часто ваш последний счет ...), вам нужно немного изменить рассуждение. Соответствующая цензура является относительно классической ...i−1
Возможный другой подход может включать в себя возможность
- Имея интенсивность, которая уменьшается со временем
- Имея интенсивность, которая уменьшается со временем, проведенным с момента последнего голосования (я предпочитаю это. В этом случае есть классический способ моделирования, как плотность уменьшается ...
- Вы можете предположить, что является гладкой функцией отμ+ii
- .... вы можете предложить другие идеи!