Скрытая марковская модель против модели перехода Маркова против модели состояния пространства…?


18

Для моей магистерской работы я работаю над разработкой статистической модели для переходов между различными состояниями, определяемыми серологическим статусом. Пока я не буду вдаваться в подробности этого контекста, так как мой вопрос носит более общий / теоретический характер. Во всяком случае, моя интуиция заключается в том, что я должен использовать скрытую марковскую модель (HMM); Проблема, с которой я сталкиваюсь при изучении литературы и других исходных исследований, необходимых для формулирования моей модели, заключается в путанице в терминологии и точных различиях между различными типами скрытых моделей процессов. Я только очень смутно осознаю, что их отличает (примеры впереди). Кроме того, мне кажется, что, по крайней мере из того, что я видел в литературе, есть очень нестандартный словарь, построенный вокруг этого типа моделирования,

Итак, я надеялся, что люди могут помочь мне устранить некоторые из этих терминов для меня. У меня есть несколько вопросов, но я предполагаю, что, если один или два ответят удовлетворительно, остальные в результате будут распутаны. Я надеюсь, что это не слишком многословно; если модератор хочет, чтобы я разделил это на несколько постов, я это сделаю. В любом случае, я выделил свои вопросы жирным шрифтом, а затем подробно изложил вопрос, который я обнаружил во время поиска литературы.

Итак, в произвольном порядке:

1) Что такое «модель скрытого процесса»?

У меня сложилось впечатление, что «модель скрытого процесса» является своего рода зонтичным термином, который можно использовать для описания ряда различных типов статистических моделей, причем все они, по сути, являются вероятностными описаниями данных временных рядов, сгенерированных «системой перекрытия, потенциально скрытые, линейно-аддитивные процессы "([1]). Действительно, [2] определяет «модель скрытого процесса» как «общий термин, относящийся либо к модели пространства состояний, либо к скрытой марковской модели». [1], по-видимому, делает вывод, что скрытая марковская модель является подтипом скрытых моделей процессов, специально ориентированных на вывод о бинарных состояниях; мне кажется, что в основе этой модели скрытого процесса лежит обобщение скрытой марковской модели. Иногда я вижу «модель скрытого процесса» и фразу «

Правильна ли эта интуиция с моей стороны? Если нет, есть ли у кого-нибудь ссылка, которая более четко очерчивает эти методы?

2) В чем разница между скрытой марковской моделью и моделью пространства состояний?

Снова возвращаясь к [2] (хотя бы потому, что статья содержит четкий глоссарий терминов, а не потому, что сам документ кажется особенно авторитетным; это просто удобный источник определений из одного предложения), различие заключается в том, что Скрытая марковская модель - это особый тип модели пространства состояний, в которой состояния являются марковскими (кажется, что нет определенного ограничения порядка марковского процесса; т. е. первый порядок, ..., k-й порядок). Здесь модель пространства состояний определяется как «модель, которая запускает два временных ряда параллельно, одна фиксирует динамику истинных состояний (скрытых), а другая состоит из наблюдений, которые сделаны из этих базовых, но, возможно, неизвестных состояний». Если эти состояния также обладают свойством Маркова, то это скрытая марковская модель.

Однако [3] определяет различие между моделями пространства состояний и скрытыми марковскими моделями как связанное с характеристиками скрытого состояния. Здесь скрытая модель Маркова имеет дело с дискретными состояниями, в то время как модели пространства состояний имеют дело с непрерывными состояниями; в противном случае они концептуально идентичны.

Мне кажется, это два совершенно разных определения. С одной стороны, скрытая марковская модель является подтипом модели пространства состояний, тогда как с другой стороны, они оба представляют собой просто разные экземпляры более широкого класса моделей скрытых процессов. Что из этого является правильным? Моя интуиция подсказывает мне следовать [3], а не [2], но я не могу найти авторитетный источник, который это поддерживает.

3) Что такое «марковская модель перехода»?

Еще один термин, который вошел в множество источников, - это «Марковская модель перехода». Я не смог найти эту фразу ни в одном учебнике, но она часто встречается в журнальных статьях (просто подтвердите ее в Google). Мне не удалось найти строгое определение этого термина (каждая найденная мной статья ссылается на другую статью, которая ссылается на другую и т. Д., Направляя меня в кроличью нору PubMed, которая никуда не ведет). Из контекста у меня складывается впечатление, что это очень общий термин для обозначения любой модели, в которой объектом вывода являются переходы между состояниями, которые следуют за марковским процессом, и что скрытую марковскую модель можно рассматривать как особый тип марковской модели перехода. , [4], однако, похоже, используют модель перехода, скрытую марковскую модель и несколько похожих терминов взаимозаменяемо.

С другой стороны, [5] говорит о марковских моделях перехода и скрытых марковских моделях немного по-другому. Авторы утверждают: «Модели переходов предоставляют метод обобщения динамики респондентов, который помогает интерпретировать результаты более сложных скрытых марковских моделей». Я не совсем понимаю, что они подразумевают под этой фразой, и не могу найти оправдания этому в другом месте в газете. Однако они, по-видимому, подразумевают, что марковские модели переходов используют время как непрерывную переменную, в то время как скрытые марковские модели используют время как дискретную переменную (они прямо не говорят об этом; они говорят, что используют пакет R 'msm', чтобы соответствовать марковскому переходу модели, а затем описывают «msm» как непрерывную обработку времени в отличие от пакета R для HMM).

4) Где вписываются другие концепции, например, динамические байесовские сети?

Согласно Википедии, динамическая байесовская сеть - это «обобщение скрытых марковских моделей и фильтров Калмана». В других местах я видел скрытые марковские модели, определенные как частный случай динамической байесовской сети, «когда все состояние мира представлено одной скрытой переменной состояния» ( определение динамической байесовской системы и ее связь с HMM? ) , Я обычно понимаю эту связь, и это хорошо объясняется [6].

Однако мне трудно понять, как эти отношения вписываются в более широкую картину вещей. То есть, учитывая эту взаимосвязь между HMM и DBN, как модели пространства состояний и модели скрытых процессов связаны с этими двумя? Как все эти разные типы методов взаимосвязаны, если учесть, что существует множество «обобщений» скрытых марковских моделей?


Ссылки:

[1] Том М. Митчелл, Ребекка Хатчинсон, Индраяна Рустанди. «Модели скрытых процессов». 2006. CMU-CALD-05-116. Университет Карнеги Меллон.

[2] Оливер Гиминез, Жан-Доминик Лебретон, Жан-Мишель Гайяр, Реми Шоке, Роджер Прадель. «Оценка демографических параметров с использованием динамических моделей скрытого процесса». Теоретическая популяционная биология. 2012. 82 (4): 307-316.

[3] Барбара Энгельхардт. «Скрытые марковские модели и государственные космические модели». STA561: вероятностное машинное обучение. Университет Дюка. http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf

[4] Jeroen K. Vermunt. «Многоуровневое латентное моделирование Маркова в непрерывном времени с применением к анализу данных оценки амбулаторного настроения». Семинар по социальной статистике. 2012. Тилбургский университет. http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf

[5] Кен Ричардсон, Дэвид Харт, Кристи Картер. «Понимание изменений здоровья и рабочей силы: применение марковских моделей к продольным данным SoFIE». Официальная статистическая исследовательская серия. 2012.

[6] Зубин Гахрамани. «Введение в скрытые марковские модели и байесовские сети». Журнал распознавания образов и искусственного интеллекта. 2001. 15 (1): 9-42.


Вы также можете попробовать рекуррентную нейронную сеть. В распознавании речи некоторые успешно используют их в качестве замены для HMM.
Альберт

Спасибо за предложение. Сейчас я предпочитаю уточнить свои вопросы по этим методам, прежде чем перейти к изучению новых.
Райан Симмонс

Они относятся к одному и тому же. Пожалуйста, смотрите scholarpedia.org/article/State_space_model Sangdon

2
@Ryan Simmons Я думаю, что было бы неплохо проверить видео с математической монкой (Джеффри Миллер) о цепях Маркова и скрытых моделях Маркова на YouTube.
ДжимБой,

Поскольку вы, вероятно, уже представили свою диссертацию, не могли бы вы ответить на этот вопрос самостоятельно? Я, например, хотел бы получить ответ экспертов, который, вероятно, относится и к почти 800 другим людям, которые читают этот вопрос.
Ульф Аслак

Ответы:


4

Следующее цитируется с сайта Scholarpedia :

Модель пространства состояний (SSM) относится к классу вероятностной графической модели (Koller and Friedman, 2009), которая описывает вероятностную зависимость между скрытой переменной состояния и наблюдаемым измерением. Состояние или измерение могут быть непрерывными или дискретными. Термин «государственное пространство» возник в 1960-х годах в области техники управления (Kalman, 1960). SSM обеспечивает общую структуру для анализа детерминированных и стохастических динамических систем, которые измеряются или наблюдаются в ходе случайного процесса. Структура SSM была успешно применена в технике, статистике, информатике и экономике для решения широкого спектра задач динамических систем. Другими терминами, используемыми для описания SSM, являются скрытые марковские модели (HMM) (Rabiner, 1989) и модели скрытого процесса. Наиболее хорошо изученным SSM является фильтр Калмана,


3

Я и Алан Хоукс написали довольно много об агрегированных марковских процессах с дискретными состояниями за непрерывное время. Наш материал был посвящен проблеме интерпретации наблюдений за молекулами одиночных ионных каналов и включает точную обработку пропущенных коротких событий. Подобная теория работает и в теории надежности. Это вполне может быть адаптировано к другим проблемам. См. Http://www.onemol.org.uk/?page_id=175 для ссылок.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.