Я абсолютно новичок в статистике и области доверительных интервалов. Так что это может быть очень тривиально или даже звучать глупо. Я был бы признателен, если бы вы могли помочь мне понять или указать мне литературу / текст / блог, который объясняет это лучше.
Я вижу на различных новостных сайтах, таких как CNN, Fox news, Politico и т. Д., Об их опросах, касающихся президентской гонки 2012 года в США. Каждое агентство проводит некоторые опросы и сообщает некоторые статистические данные в форме:
CNN: популярность Обамы составляет X% с погрешностью +/- x1%. Размер выборки 600. FOX: популярность Обамы составляет Y% с погрешностью +/- y1%. Размер выборки 800. XYZ: популярность Обамы составляет Z% с погрешностью +/- z1%. Размер выборки 300.
Вот мои сомнения:
Как мне решить, кому доверять? Должно ли оно основываться на доверительном интервале, или я должен предположить, что, поскольку Fox имеет больший размер выборки, его оценка является более надежной? Существует ли неявная связь между доверительной вероятностью и размером выборки, так что указание одной исключает необходимость указания другой?
Могу ли я определить стандартное отклонение от доверительных интервалов? Если это так, действительно ли оно всегда или действительно только для определенных распределений (например, гауссовых)?
Есть ли способ, которым я могу «объединить» или «объединить» вышеупомянутые три оценки и получить мою собственную оценку вместе с доверительными интервалами? Какой размер выборки я должен заявить в этом случае?
Я упомянул CNN / Fox только для того, чтобы лучше объяснить мой пример. Я не собираюсь начинать дебаты между демократами и республиканцами здесь.
Пожалуйста, помогите мне понять вопросы, которые я поднял.