Ответы до сих пор были сосредоточены на самих данных , что имеет смысл с сайтом, на котором он находится, и недостатками.
Но я склонен к вычислительным / математическим эпидемиологам по склонности, поэтому я также собираюсь немного рассказать о самой модели, потому что она также имеет отношение к обсуждению.
На мой взгляд, самая большая проблема с бумагой - это не данные Google. Математические модели в эпидемиологии постоянно обрабатывают грязные данные, и, на мой взгляд, проблемы с ними можно решить с помощью довольно простого анализа чувствительности.
Самой большой проблемой для меня является то, что исследователи «обречены на успех», чего всегда следует избегать в исследованиях. Они делают это в модели, которую они решили вписать в данные: стандартная модель SIR.
Вкратце, модель SIR (которая обозначает восприимчивое (S) инфекционное (I) выздоровление (R)) представляет собой серию дифференциальных уравнений, которые отслеживают состояние здоровья населения, когда оно испытывает инфекционное заболевание. Зараженные люди взаимодействуют с восприимчивыми людьми и заражают их, а затем со временем переходят в выздоровевшую категорию.
Это создает кривую, которая выглядит следующим образом:
Красиво, не правда ли? И да, это для эпидемии зомби. Длинная история.
В этом случае красная линия - это то, что моделируется как «пользователи Facebook». Проблема заключается в следующем:
В базовой модели SIR класс I в конце концов неизбежно асимптотически приближается к нулю .
Это должно случиться. Не имеет значения, моделируете ли вы зомби, корь, Facebook или Stack Exchange и т. Д. Если вы моделируете это с помощью модели SIR, неизбежный вывод состоит в том, что численность инфекционного (I) класса падает примерно до нуля.
Существуют чрезвычайно простые расширения модели SIR, которые делают это неправдой - либо вы можете заставить людей из восстановленного (R) класса возвращаться к восприимчивому (S) (по сути, это будут люди, которые оставили Facebook, переходя из «Я никогда не возвращаясь "к" я мог бы вернуться когда-нибудь "), или вы можете позволить новым людям появиться среди населения (это будут маленькие Тимми и Клэр, получающие свои первые компьютеры).
К сожалению, авторы не подходили под эти модели. Это, кстати, распространенная проблема в математическом моделировании. Статистическая модель - это попытка описать шаблоны переменных и их взаимодействия в данных. Математическая модель - это утверждение о реальности . Вы можете получить модель SIR, подходящую для многих вещей, но ваш выбор модели SIR также является подтверждением системы. А именно, что когда оно достигает пика, оно движется к нулю.
Кстати, интернет-компании используют модели удержания пользователей, которые во многом похожи на модели эпидемий, но они также значительно сложнее, чем те, которые представлены в документе.