Хранилища данных общественного здравоохранения в Соединенных Штатах движутся в направлении AGE в формате лет с шагом в пять лет из-за воздействия правил HIPAA, касающихся преднамеренного ослепления и маскировки данных в целях личной конфиденциальности.
Учитывая эту проблему с тем, что было в прошлом (до HIPAA) довольно масштабным элементом данных уровня мер, основанным на разнице между датой рождения и датой смерти, нам, возможно, придется пересмотреть AGE как переменную шкалы, которая может быть Параметрически описаны вообще в наборах данных общественного здравоохранения, в пользу моделей, которые описывают AGE непараметрическим способом, как порядковый уровень измерения. Я знаю, что это может показаться «чрезмерным» многим фракциям в сообществе биомедицинской информатики, но эта идея может иметь некоторую ценность с точки зрения «интерпретации», как описано в комментариях выше.
Как насчет всей аналитической силы, которая доступна для непараметрических подходов? Да, это правда, что каждый из нас почти повсеместно будет пытаться применить методы GLM (общая линейная модель) к переменной, которая представляется нам в распределениях, которые ведут себя так, как AGE.
В то же время необходимо учитывать форму этого распределения и то, как эта форма определяется эффектами многомерного взаимодействия на многомерных центроидах и центроидах подгрупп, присутствующих в распределении. Что делать с этими очень сложными наборами данных?
Когда элемент данных не соответствует «допущениям модели», мы постепенно сканируем (я сказал поперек, а не вниз; мы должны быть равноправными работодателями метода, каждый инструмент поставляется фабрикой с формой, соответствующей правилам функции), список Из других возможных моделей можно найти те, которые «не подведут» тесты допущений.
В существующем формате в наборах данных общественного здравоохранения нам действительно (как сообществу по визуализации данных) действительно нужно придумать более стандартную модель для обработки AGE с шагом в пять лет (5YI). Мой голос за визуализацию данных AGE (с учетом нового формата 5YI) заключается в использовании гистограмм и графиков прямоугольников и усов. Да, это означает, медиана. (Не каламбур!)
Иногда картинка действительно стоит тысячи слов, а реферат - это краткое изложение тысячи слов. График прямоугольника и вискера показывает «форму» распределения как значимое символическое представление гистограммы с почти пиктограммой разрешения. Сравнение распределений пятилетних возрастных возрастов с показом бокса «бок о бок» и графиков усов, где можно мгновенно визуально сравнить паттерны от 75-го до 50-го (медиана) с уровнем ниже 25-го ntile, сделало бы элегантный «универсальный стандарт» для сравнения AGE через мир. Для тех из нас, кто продолжает получать удовольствие от представления данных с помощью текстовой механики табличного отображения, диаграмма «ствол и лист» также может быть полезна, когда она используется в качестве элемента анимированной визуальной графики в «спарклайне».
ВОЗРАСТ достиг совершеннолетия. Это требует дальнейшего изучения с помощью более мощных вычислительных алгоритмов, которые сейчас доступны.