Мне дали данные для анализа исследования, изучающего влияние лечения на уровни железа в четыре разных момента времени (до лечения, день лечения закончился, через 4 недели после лечения и через 2-4 месяца после лечения). Контрольной группы нет. Они хотят увидеть, наблюдается ли значительное повышение уровня железа в каждой из 3 временных точек после лечения до уровня до лечения (базовый уровень). Одиннадцать пациентов имели базовые уровни, но только 8 пациентов имели полные данные для всех 4 временных точек ( = 11, 10, 9 и 8 для каждой временной точки). Были измерены не только уровни железа, но и два других лабораторных измерения в каждый момент времени для сравнения с исходным уровнем.
У меня есть несколько вопросов о том, как это проанализировать. Сначала я подумал, что для анализа этих данных подойдет RM ANOVA, но меня беспокоит небольшой размер выборки, потеря данных и ненормальное распределение данных. Затем я подумал о том, чтобы сравнить каждую меру после лечения с базовой линией, используя тесты Уилкоксона со знаком, но потом я столкнулся с проблемой множественных сравнений. Тем не менее, я прочитал некоторую литературу, которая преуменьшает необходимость проведения нескольких сравнений. Итак, в целом, я имею дело с небольшими размерами выборки, неполными данными и множественными сравнениями (и нужно ли это или нет).
Я надеюсь, что все это имело смысл. Я новичок в CrossValidated и был направлен сюда коллегой, чтобы учиться у опытных статистиков, поэтому я буду признателен за любой совет! Благодарность!
Отредактировано, чтобы добавить необработанные данные из комментария:
Всего четыре момента времени и переменная результата непрерывна. Например, результаты в каждый момент времени выглядят примерно так:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]