Используя среднюю длину и средний вес для расчета среднего ИМТ?

Допустимо ли использовать среднюю длину ( ) и средний вес ( )) из данной популяции для расчета среднего индекса тела ( ) для этой популяции? $h$ $w$ $BMI = \frac{w}{h^2}$

mean sample population

— Софи Мишель
источник

Вопрос не в том, что абстрактно (согласно @ комментарию JoeTaxpayer): типичные реальные ИМТ (15.0-30.0) уже все равно будут округлены до 1 dp, поэтому, если ошибка в среднем ИМТ из-за соотношения средних составляет ~ 0,05 -0.1 математически незначительно (<1%); для большинства реальных распределений (рост, вес). Мы не говорим о Лорел и Харди ...

— smci

Ответы:

Математически это не тот случай, когда они обязательно близки. Это сработало бы, если бы это было так, что $E(Y/X^2) = E(Y)/E(X)^2$ но в целом это неверно, а в некоторых конкретных ситуациях это может быть довольно далеко.

Тем не менее, для довольно реалистичного набора двумерных данных о росте и весе, похоже, что воздействие будет небольшим.

Например, рассмотрим модель роста и веса взрослого мужчины в США в работе Brainard and Burmaster (1992) [1]; эта модель представляет собой двумерную нормаль по росту и логарифму (весу), которая хорошо вписывается в данные о росте и весе и позволяет легко получить реалистичное моделирование. Хорошая модель для женщин немного сложнее, но я не ожидаю, что она сильно повлияет на качество приближения ИМТ; Я просто собираюсь делать мужчин, потому что очень простая модель очень хорошая.

Преобразование модели для мужского роста и веса в метрику и моделирование 100 000 двумерных точек в R до расчета индивидуальных ИМТ и, следовательно, среднего ИМТ, а также расчета среднего роста на (средний вес) в квадрате, оказывается, что результатом было то, что средний ИМТ был (на четыре цифры) 25,21 и $\bar{h}/\bar{w}^2$ был 25,22, который выглядит довольно близко.

Если посмотреть на эффект варьирования параметров, то похоже, что влияние использования смещенной оценки среднего значения для женщин будет, вероятно, немного большим, но все же недостаточно существенным, что, вероятно, станет большой проблемой.

В идеале должно быть проверено что-то ближе к любой ситуации, для которой вы хотите его использовать, но, вероятно, это будет довольно хорошо.

Таким образом, для типичной ситуации кажется маловероятным, чтобы на практике это было большой проблемой.

[1]: Брейнард Дж. И
Бурмастер , Д.Е. (1992), «Двусторонние распределения для роста и веса мужчин и женщин в Соединенных Штатах»,
Анализ риска , Vol. 12, № 2, стр. 267-275

— Glen_b - Восстановить Монику
источник

Это не совсем правильно, но обычно это не имеет большого значения.

Например, предположим, что ваше население имеет вес 80, 90 и 100 кг, а его рост составляет 1,7, 1,8 и 1,9 метра. Тогда ИМТ 27,68, 27,78 и 27,70. Среднее значение ИМТ составляет 27,72. Если вы рассчитываете ИМТ по средним значениям весов и высот, вы получаете 27,78, что немного отличается, но обычно не имеет большого значения.

— Стефан Коласса
источник

Большое спасибо за ваш ответ! Таким образом, это означает, что этот метод вычислений, вероятно, не подходит для любого типа статистического анализа, верно?

— Софи Мишель

Честно говоря, я бы не пошел так далеко. В любом случае статистика имеет дело с зашумленными данными, и небольшая неточность в измерении высот или весов может затмить разницу, которую мы имеем здесь. Я бы порекомендовал вам что-то смоделировать в соответствии с данными, которые вы собираетесь использовать, а затем подумать, действительно ли эти крошечные различия повлияют на ваш статистический анализ.

— Стефан Коласса

«Если вы рассчитываете ИМТ по средним значениям веса и высоты, вы получаете 27,78» Но это равно максимуму ИМТ! Получение максимума вместо среднего мне кажется большой разницей.

— накопление

@ Накопление - точка Стефана была мертвой, но выбор чисел не очень хорошо иллюстрировал ситуацию. ИМТ для «нормального» составляет от 18,5 до 24,9. 3 ИМТ в этом примере имеют диапазон от низкого до высокого .1. Разница в 1/2% в этих данных - шум. ИМТ 5'8 "человека поднимается с 27,4 до 27,5 при увеличении его веса со 180 до 181. 1 фунт - это разница между выпиванием высокого стакана воды до или после того, как он

— попадет

@JoeTaxpayer: Я думаю, что вы имеете в виду, что типичные ИМТ (15.0-30.0) уже все равно будут округлены до 1dp, поэтому, если ошибка в среднем ИМТ из-за использования соотношения средних <0,05, математически ничтожна. Верный?

— smci

Хотя я согласен с другими ответами, что вполне вероятно, что этот метод приблизит среднее значение ИМТ, я хотел бы отметить, что это только приближение.

Я на самом деле склонен сказать, что вы не должны использовать метод, который вы описываете, поскольку он просто менее точен. Это тривиально, чтобы рассчитать ИМТ для каждого человека, а затем взять среднее значение этого, давая вам реальный средний ИМТ.

Здесь я иллюстрирую две крайности, где средние значения веса и длины остаются неизменными, но средний ИМТ фактически отличается:

Используя следующий (matlab) код:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.5, 1.5, 1.5, 1.8, 1.8, 1.8;]; % OUR DATA
length = length.^2;
bmi = weight./length;
scatter(1:size(weight,2), bmi, 'filled');
yline(mean(bmi),'red','LineWidth',2);
yline(mean(weight)/mean(length),'blue','LineWidth',2);
xlabel('Person');
ylabel('BMI');
legend('BMI', 'mean(bmi)', 'mean(weight)/mean(length)', 'Location','northwest');

Мы получаем:

Если мы просто переупорядочим длины, мы получим другой средний ИМТ, а среднее (вес) / среднее (длина ^ 2) останется прежним:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.8, 1.8, 1.8, 1.5, 1.5, 1.5;]; % OUR DATA (REORDERED)
... % rest is the same

Опять же, используя реальные данные, вполне вероятно, что ваш метод будет приближаться к реальному среднему значению ИМТ, но почему вы используете менее точный метод?

За рамками вопроса: всегда хорошая идея визуализировать ваши данные, чтобы вы могли увидеть распределение. Например, если вы заметили определенные кластеры, вы также можете рассмотреть возможность получения отдельных средств для этих кластеров (например, отдельно для первых 3 и последних 3 человек в моем примере)

— Deruijter
источник

«Тривиально рассчитать ИМТ для каждого человека, а затем взять среднее значение, давая вам реальный средний ИМТ». Да, если у вас есть необработанные данные. Если все, что у вас есть, - это сводная статистика по населению, такая как средний рост и вес, то вы можете получить "BMI населения" из них - это лучшее, что вы можете сделать, и вопрос о том, насколько плохой является приблизительное приближение.

— Стефан Коласса

+1 Не агрегируйте агрегаты, если вы можете получить тот же вид ответа, агрегируя необработанные данные. Есть ответы и комментарии, которые в этом случае имеют незначительное / нет / тонкое / незначительное значение, но не делайте этого. Изучите и используйте полезные методы анализа данных, делайте это правильно.

— Стиан Иттервик