Я сгруппировал свой набор данных из нескольких тысяч цепей Маркова первого порядка примерно в 10 кластеров.
Есть ли какой-нибудь рекомендуемый способ, как я могу оценить эти кластеры и выяснить, какие элементы в кластерах совместно используются и как они отличаются от других кластеров? Таким образом, я могу сделать заявление типа «Процессы в кластере A имеют тенденцию оставаться в состоянии Y, как только они туда попадут, что неверно для процессов в других кластерах».
Матрицы перехода этих цепей Маркова слишком велики, чтобы просто «посмотреть и посмотреть». Они относительно редки, если это может помочь.
Моя идея состояла в том, чтобы взять все матрицы переходов в кластере, суммировать их и построить их как интенсивность на рисунке (в масштабе от 0 до 255). Есть что-то более «профессиональное», что я должен попробовать?