Анализ временной шкалы


10

Я провожу исследование взаимосвязи между порядком рождения человека и последующим риском ожирения, используя данные нескольких одногодичных когорт (например, http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Основная проблема заключается в том, что порядок рождения связан с другими характеристиками, такими как возраст матери, количество младших и / или старших братьев и сестер и интервал между родами, которые также могут влиять на результат с помощью различных механизмов. Кроме того, любое влияние, которое эти вещи оказывают на последующий риск ожирения, может быть изменено гендерным составом братьев и сестер, включая «индексного ребенка» (участника когорты при рождении).

Для каждого индексного ребенка можно было нарисовать график времени, показывающий все рождения в семье с указанием возраста матери в зависимости от времени.

введите описание изображения здесь

Я пытаюсь определить методы для анализа данных такого рода, где порядок, время и характер событий могут быть важны. Я задаю этот вопрос здесь из-за разнообразия приложений, с которыми работают участники, - я ожидаю, что у кого-то есть какие-то немедленные предложения, которые займут у меня намного больше времени, чтобы идентифицировать в одиночку. Любые толчки в правильном направлении (ах) будут с благодарностью.

Смежные вопросы: Как мне анализировать данные об интервалах рождения женщин?


1
+1. Обычный вопрос: у вас есть данные для ИМТ родителей?
Охотник на оленей

Да, есть некоторые продольные антропометрические данные для матерей по индексу детей. К сожалению, не в отношении братьев и сестер, исключая какие-либо противоречия между семейными анализами.
DL Dahly

На данный момент не так много полезных мыслей по поводу сроков. Вы можете хотеть иметь материнский возраст при первых родах как другую независимую переменную; Я предполагаю, что вы уже сделали предварительный анализ и визуализацию ...
Охотник на оленей

Очевидно, что материнский возраст важен для учета, поэтому на приведенных выше графиках в качестве временной переменной используется материнский возраст. Я думаю, что я надеюсь найти альтернативный метод, который предлагает больше, чем просто бросить все в линейную модель.
DL Dahly

Не уверен, что это имеет значение, но я думаю, что вес при рождении или средний вес при рождении у женщин могут быть интересными ковариатами. Кроме того, можете ли вы предоставить больше информации о ваших результатах? Вы повторили меры?
ReliableResearch

Ответы:


2

Вы можете рассмотреть возможность использования многоуровневых моделей (смешанная регрессия) для оценки межсемейных и внутрисемейных эффектов. Одна из возможных стратегий заключается в использовании планового подхода к построению иерархической модели. Например, протестируйте каждого потенциального предиктора в одномерной модели. Если межсемейные эффекты устраняют эффект порядка рождения, то это настоятельно предполагает, что порядок рождения не важен, но существуют другие факторы. Пример цитаты для этого для эффектов порядка рождения на IQ:

Я надеюсь, что это полезно.


+1 за хорошую идею, с которой я тоже сталкивался, но у меня нет данных о результатах родных братьев и сестер для этого конкретного анализа.
Д.Л. Дахли,

0

Я рассматриваю это как статистический вопрос, и у меня нет специальных знаний по медицинским вопросам.

Глядя на статью, на которую вы ссылаетесь, я вижу, что в одной когорте было 970 человек. Если у вас есть данные о нескольких когортах примерно такого же размера, то общий размер вашего набора данных дает возможность выбрать достаточно большие подмножества, в которых временная шкала каждого отдельного человека соответствует определенным условиям. Например, подмножество может включать, скажем, всех лиц мужского пола в возрасте от 25 до 29 лет. Регрессия для такого подмножества подходящей меры более позднего ожирения по отношению к порядку рождения устранит любое возможное влияние на последующее ожирение различий в полу индексного ребенка и в значительной степени устранит любой возможный эффект материнского возраста.

Нелегко распространить этот подход на пол братьев и сестер, поскольку, если одним условием для подмножества было, скажем, то, что у индексного ребенка есть старшая родная сестра, это означает, что индексный ребенок сам по себе не является старшим, что сужает диапазон независимой переменной в регрессии. Однако, обходным путем может быть определение условий с использованием «если таковые имеются». Например, подмножество может быть определено, чтобы включать всех мужчин мужского пола в возрасте от 25 до 29 лет и со старшими братьями и сестрами, если таковые имеются, все женщины. Такое подмножество будет по-прежнему включать лиц с любым порядком рождения.

Если подмножество было определено слишком сложным набором условий, то число индивидов, которое оно содержало, могло бы быть настолько маленьким, что полученные оценки коэффициентов были бы слишком неточными, чтобы быть полезными. Если бы этот подход был принят, то, вероятно, потребовался бы объективный компромисс при определении подмножеств между устранением как можно большего количества возможных эффектов и включением достаточного количества людей для получения полезного результата.


Спасибо за ответ, Адам. В этом случае, однако, я не думаю, что стратификация выборки скажет вам что-либо, кроме подобной скорректированной модели. Вполне возможно, что правильно заданная линейная модель - лучший способ сделать это ... Я просто надеялся увидеть, справляются ли статистики в других областях с подобными проблемами по-разному.
DL Dahly

Я согласен - если это то, что вы говорите - что мой подход эквивалентен одной регрессии на всем наборе данных с использованием многочисленных индикаторных переменных. Если взять в качестве примера материнский возраст, потенциальная проблема любой модели, которая рассматривает ее как непрерывную переменную, состоит в том, что она требует предположения о функциональной форме (связь между возрастом матери и последующим ожирением может быть криволинейной). В отличие от этого, модель, использующая набор индикаторных переменных для диапазонов материнского возраста, не нуждается в таком допущении и в этом отношении является более общей.
Адам Бейли

0

Я бы предложил провести функциональный анализ данных, но я подозреваю, что у вас может быть много семей, в которых слишком мало детей, чтобы получить разумные оценки. Продолжайте читать, хотя, поскольку это отвечает вашим потребностям. Возможно, кто-то уже использовал это с подобными данными.

Если вы не хотите делать что-то столь непараметрическое, вы должны использовать свой клинический опыт, чтобы уменьшить размерность данных. Например, одна переменная в вашей модели может быть числом детей, другая - средним числом лет между детьми и так далее. Если есть какой-либо эффект в этих переменных, он может отображаться, даже если вы не указали правильную функциональную форму немедленно. Дальнейшее построение модели, основанное на знаниях, может позволить вам построить модель с высокой степенью прогнозирования - просто убедитесь, что вы сохранили набор валидации!


Я использую FDA и не уверен, как это применимо. Я мог бы установить ось x = 0 для каждого дочернего индекса, и чтобы другие братья и сестры были нанесены на эту ось в +/- времени; и иметь материнский возраст в качестве оси у; а затем оценить монотонный объект функциональных данных для каждого дочернего индекса ... но как только я это сделал, я потерял всю информацию о фактическом количестве братьев и сестер и о том, где они находятся вдоль линии (потому что теперь все суммируется функция). FDA включает в себя несколько способов анализа - вы имели в виду что-то более конкретное?
DL Dahly
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.