Есть идеи, почему мы не используем значимые цифры в статистике? Что-то вроде того, что мы используем оценки, поэтому правила о точности не применяются;)?
Есть идеи, почему мы не используем значимые цифры в статистике? Что-то вроде того, что мы используем оценки, поэтому правила о точности не применяются;)?
Ответы:
Значимые цифры используются в некоторых областях (я узнал о них в химии), чтобы указать степень значимой точности, которая существует в числе. Это также важная тема в статистике, поэтому мы постоянно сообщаем об этом - мы просто сообщаем об этом в другой форме. В частности, мы сообщаем доверительные интервалы , которые указывают уровень точности оценки (такой как среднее значение).
После того как вы указали 95% -й доверительный интервал для оценки, например , вы можете указать количество цифр для своего среднего значения, например, , и проблем не будет. На самом деле, статистик Эндрю Гельман рекомендовал перечислить как минимум четыре (2009, стр. 4) . 0,50129519823975923
Одна из причин ограничения количества цифр, сообщаемых во многих оценках, p-значениях и т. Д., Основана на восприятии. Сообщение о чем-то вроде p = 0.04872429 подразумевает уровень точности в результатах, который заставляет их восприниматься как более точные .
По сути, использование большого количества цифр в отчетах о статистических результатах является слишком большой попыткой скрыть ваши выводы в незаслуженном авторитете.
Я думаю, что это действительно зависит от требуемого уровня достоверности, для 95% подходит меньшее количество цифр значимости, в отличие от 99,999% или выше, например, используемых ЦЕРН для многих их результатов.
Вы говорите о округлении ваших данных до некоторого числа значащих цифр или округлении вашего окончательного ответа? Если вы округлите свои данные, вы можете попасть в ситуации, в которых вы выбросили шум, который необходимо использовать для статистических расчетов.