В настоящее время я работаю с большим количеством данных о страховых случаях, включая некоторые лабораторные и аптечные претензии. Однако наиболее согласованная информация в наборе данных состоит из диагноза (ICD-9CM) и кодов процедур (CPT, HCSPCS, ICD-9CM).
Мои цели:
- Выявить наиболее влиятельные исходные состояния (сопутствующие заболевания) для такого заболевания, как хроническое заболевание почек;
- Определите вероятность (или вероятность) того, что у пациента разовьется заболевание, основываясь на состояниях, которые у него были в прошлом;
- Сделайте так же, как 1 и 2, но с процедурами и / или диагнозами.
- Желательно, чтобы результаты были интерпретированы врачом
Я смотрел на такие вещи, как документы о важности Премии Здоровья Наследия, и многому научился у них, но они сосредоточены на прогнозировании госпитализаций.
Итак, вот мои вопросы: Как вы думаете, какие методы хорошо подходят для подобных проблем? И какие ресурсы были бы наиболее полезны для изучения приложений и методов науки о данных, относящихся к здравоохранению и клинической медицине?
РЕДАКТИРОВАТЬ # 2, чтобы добавить текстовую таблицу:
ХБП является целевым состоянием, «хроническое заболевание почек», «.any» означает, что они приобрели это состояние в любое время, «.isbefore.ckd» означает, что у них было это состояние до первого диагноза ХБП. Другие аббревиатуры соответствуют другим условиям, указанным в кодовых группах ICD-9CM. Эта группировка происходит в SQL во время процесса импорта. Каждая переменная, за исключением Patient_age, является двоичной.