Какой смысл сообщать описательную статистику?


21

Я только что провел анализ своих данных с использованием логистической регрессии, однако мне также необходимо иметь описательную часть статистики в моем отчете. Я, честно говоря, не вижу в этом смысла, и я надеялся, что кто-то сможет объяснить, почему это необходимо.

Например, если я строю гистограмму одной из моих независимых непрерывных переменных, и она показывает нормальность или асимметрию, как это добавит какое-либо значение в отчет?

Мои данные состоят из зависимой переменной true или false для получения работы, а независимой переменной являются оценки в среднесрочной перспективе, оценки в итоговых экзаменах, а также мужчины или женщины.


Если вы не видите никакой ценности в построении гистограммы ваших IV, то, возможно, вам не следует этого делать, но есть ли какие-то собранные вами данные, которые, по вашему мнению, имеют какое-то значение для работы, которую вы представляете в Отчет?
января

Привет, Ян, я добавил еще несколько деталей относительно моей проблемы. Я довольно новичок в статистике, и мне просто интересно, есть ли общий подход, который мы используем, прежде чем проводить логистическую регрессию.
user3223190

Я предлагаю также посмотреть и, возможно, включить различные графики данных. Например, вы можете построить график итоговой оценки по сравнению со средней оценкой с цветовым кодированием по полу и с использованием символов «получил работу» и «не получил работу».
Эмиль Фридман

Ответы:


42

В моей области описательная часть отчета чрезвычайно важна, поскольку она устанавливает контекст для обобщения результатов. Например, исследователь хочет идентифицировать предикторов черепно-мозговой травмы после несчастных случаев на мотоцикле в выборке из больницы. Ее зависимая переменная является двоичной, и у нее был ряд независимых переменных. Многовариантная логистическая регрессия позволила ей сделать следующие выводы:

  • использование шлема не скорректировано ИЛИ = 4,5 (95% ДИ 3,6, 5,5) по сравнению с использованием шлема.
  • все остальные переменные не были включены в окончательную модель.

Чтобы было ясно, с моделированием проблем не было. Мы фокусируемся на значении, которое может добавить описательная статистика.

Без описательной статистики читатель не может представить эти результаты в перспективе. Зачем? Позвольте мне показать вам описательную статистику:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

Из вышесказанного видно, что ее образец состоял из пожилых, пьяных мужчин. С помощью этой информации читатель может сказать, что, если таковые имеются, эти результаты могут сказать о травмах у молодых мужчин или травмах у нетрезвых наездников или у женщин-наездников.

Пожалуйста, не игнорируйте описательную статистику.


5
Хороший пример. Это реально или выдумано?
говорит амеба: восстанови монику

5
Спасибо, @amoeba. Цифры и статистика реальны. Однако я сменил тему на черепно-мозговую травму, чтобы защитить невинных.

3
Итак, пьяные мужчины ездят на мотоциклах без шлемов ... Кто бы мог подумать, что вы можете получить травму головного мозга?
gung - Восстановить Монику

Я наслаждаюсь бокалом хорошего австралийского красного цвета в то время, а Боб твой дядя ...

25

Смысл предоставления описательной статистики состоит в том, чтобы охарактеризовать вашу выборку, чтобы люди в других центрах или странах могли оценить, обобщают ли ваши результаты их ситуацию. Таким образом, в вашем случае табулирование пола, оценок и т. Д. Будет полезным дополнением к логистической регрессии. Это не значит, что люди могут проверить ваши предположения, хотя они могут попытаться сделать это тоже.

============== Изменить, чтобы дать ссылки на некоторые руководящие принципы, используемые в здравоохранении

В области, с которой я знаком, в сфере здравоохранения, существуют конкретные рекомендации по составлению отчетов. Они были собраны вместе в сети EQUATOR, к которой следует обращаться за последними подробностями.

В качестве примера мы можем взять клинические испытания, где соответствующее руководство - CONSORT. В документе с изложением руководства, доступного здесь и в других местах, мы читаем в таблице 1 рекомендацию 15 «Таблица, показывающая исходные демографические и клинические характеристики для каждой группы».

Есть аналогичные рекомендации для других типов исследований.


Спасибо, mdewey, поэтому, когда мы делаем различные описательные сюжеты и если мы замечаем нормальность или асимметрию, почему просто комментируем это. И поэтому в основном описательная статистика используется только для реального информирования читателя о том, с какими данными вы работаете. Очень жаль, если это может показаться элементарным
user3223190

Именно так это работает в области здравоохранения, с которой я больше всего знаком.
Mdewey

8
+1. Сначала я неправильно истолковал «в других центрах или странах» как «в других веках».
говорит амеба: восстанови монику

4

Другое дело показать, насколько хорошо ведут себя ваши переменные. Если, например, одной из ваших переменных является зарплата, и вы опросили ровно одного миллиардера, то, когда вы введете его зарплату в логистическую регрессию, она будет доминировать над всем остальным, поэтому вы, вероятно, научитесь игнорировать зарплату, независимо от того, сколько фактической информации он может содержать.

Некоторые методы более чувствительны, чем другие, к асимметрии и экстремальным значениям, и логистическая регрессия скорее на чувствительной стороне. Конечно, окончательное доказательство в пудинге, и вы можете сравнить результаты, полученные с необработанными данными, или с каждым признаком, преобразованным в нормальное состояние.


1

Описательная часть помогает понять читателю ваш набор данных. В прикладной экономике это обычно настоятельно рекомендуется, поскольку это может показать первые потенциальные недостатки в вашем анализе.

Вы можете использовать данные из разных источников, чтобы взорвать ваши описания.

1 таблицы должно быть достаточно. Тот, который вы прикрепили, не очень интуитивно понятен.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.