Ага, отличный вопрос !!
Я бы также наивно предложил S-образную логистическую кривую, но это явно не подходит. Насколько я знаю, постоянное увеличение является приблизительным, поскольку YouTube считает уникальные просмотры (по одному на IP-адрес), поэтому просмотров не может быть больше, чем компьютеров.
Мы могли бы использовать эпидемиологическую модель, где люди имеют различную восприимчивость. Чтобы было проще, мы могли бы разделить его на группу высокого риска (скажем, дети) и группу низкого риска (скажем, взрослые). Назовем пропорцию «зараженных» детей и y ( t).х ( т ) долю «зараженных» взрослых в момент времени t . Я назову X (неизвестное) число людей в группе высокого риска, а Y - (также неизвестное) количество людей в группе низкого риска.Y( т )TИксY
˙ y (t)=r2(x(t)+y(t))(Y-y(т)),
Икс˙( т ) = г1( х ( т ) + у( т ) ) ( Х- х ( т ) )
Y˙( т ) = г2( х ( т ) + у( т ) ) ( Y- у( т ) ) ,
где . Я не знаю, как решить эту систему (возможно, @EpiGrad), но, глядя на ваши графики, мы могли бы сделать несколько упрощающих предположений. Поскольку рост не насыщает, мы можем предположить, что Y очень большой, а y маленький, илир1> г2YY
˙ y
Икс˙( т ) = г1х ( т ) ( х- х ( т ) )
Y˙( т ) = г2х ( т ) ,
который предсказывает линейный рост после того, как группа высокого риска полностью заражена. Обратите внимание, что с этой моделью нет оснований предполагать, что р1> г2Y- у( т )р2
Эта система решает
y(t)=r2∫x(t
х ( т ) = хС1еИкср1T1 + С1еИкср1T
Y( т ) = г2∫х ( т ) дt + C2= г2р1журнал( 1 + С1еИкср1T) + C2,
где и С 2С1С2х ( т ) + у( т )
0600 , 000 , 000х ( т )Y( т )
˙ y (t)=r2,
Икс˙( т ) = г1х ( т ) ( х- х ( т ) )
Y˙( т ) = г2,
и решает
y(t)=r2t+C2.
х ( т ) = хС1еИкср1T1 + С1еИкср1T
Y( т ) = г2t + C2,
х ( 0 ) = 1т = 0С1= 1Икс- 1≈ 1ИксИксС2= у( 0 )С2= 0Икср1р2
Икс= 600 , 000 , 000р1= 3,667 ⋅ 10- 10р2= 1 , 000 , 000
Обновление: Из комментариев я понял, что Youtube подсчитывает количество просмотров (по-тайному), а не уникальных IP-адресов, что имеет большое значение. Вернуться к доске для рисования.
Для простоты предположим, что зрители «заражены» видео. Они возвращаются, чтобы регулярно его смотреть, пока не избавятся от инфекции. Одной из самых простых моделей является SIR (Susfeptible-Infected-Resistant), который является следующим:
S˙( t ) = - α S( т ) я( т )
я˙( t ) = α S( т ) я( т ) - βя( т )
р˙( t ) = βя( т )
αβх ( т )Икс˙( t ) = k I( т )К - среднее число просмотров в день на зараженного человека.
В этой модели число просмотров начинает резко увеличиваться через некоторое время после начала заражения, что не относится к исходным данным, возможно, из-за того, что видео также распространяются не вирусным (или мемовым) способом. Я не эксперт в оценке параметров модели SIR. Просто играя с разными значениями, вот что я придумал (в R).
S0 = 1e7; a = 5e-8; b = 0.01 ; k = 1.2
views = 0; S = S0; I = 1;
# Exrapolate 1 year after the onset.
for (i in 1:365) {
dS = -a*I*S;
dI = a*I*S - b*I;
S = S+dS;
I = I+dI;
views[i+1] = views[i] + k*I
}
par(mfrow=c(2,1))
plot(views[1:95], type='l', lwd=2, ylim=c(0,6e8))
plot(views, type='n', lwd=2)
lines(views[1:95], type='l', lwd=2)
lines(96:365, views[96:365], type='l', lty=2)
Модель, очевидно, не идеальна и может быть дополнена различными способами. Этот очень грубый набросок предсказывает миллиард просмотров где-то в марте 2013 года, давайте посмотрим ...