TL; DR: Если вы не предполагаете, что люди неоправданно плохо оценивают цвет автомобиля, или что синие автомобили неоправданно редки, большое количество людей в вашем примере означает, что вероятность того, что машина синего цвета, в основном равна 100%.
Мэтью Друри уже дал правильный ответ, но я просто хотел бы добавить к этому несколько числовых примеров, потому что вы выбрали свои числа так, что вы на самом деле получаете довольно похожие ответы для широкого диапазона различных настроек параметров. Например, предположим, как вы сказали в одном из ваших комментариев, что вероятность того, что люди правильно оценивают цвет автомобиля, составляет 0,9. То есть:
а также
p ( скажем, это не синий | автомобиль не синий ) = 0,9
p(say it's blue|car is blue)=0.9=1−p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1−p(say it is blue|car isn't blue)
Определив это, мы должны решить следующее: какова вероятность того, что машина синего цвета? Давайте выберем очень низкую вероятность, просто чтобы посмотреть, что произойдет, и скажем, что , то есть только 0,1% всех автомобилей синего цвета. Тогда задняя вероятность того, что машина синего цвета, может быть рассчитана как:p(car is blue)=0.001
p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999
Если вы посмотрите на знаменатель, то вполне ясно, что второй член в этой сумме будет пренебрежимо мал, поскольку в относительном размере членов в сумме преобладает отношение от до 0,1 900 , что составляет порядка 10 58 . И действительно, если вы выполните этот расчет на компьютере (стараясь избежать проблем с недостаточным количеством), вы получите ответ, равный 1 (с точностью до машины).0.99000,19001058
Причина, по которой предыдущие вероятности на самом деле не имеют большого значения, заключается в том, что у вас есть так много доказательств одной возможности (машина синего цвета) по сравнению с другой. Это может быть количественно определено отношением правдоподобия , которое мы можем рассчитать как:
p ( ответы | машина синего цвета )p ( ответы | машина не синяя )= 0,9900× 0,11000,1900× 0,9100≈ 10+763
Таким образом, даже прежде, чем рассматривать предыдущие вероятности, фактические данные предполагают, что один вариант уже астрономически более вероятен, чем другой, и для предыдущего, чтобы иметь какое-либо значение, синие автомобили должны были бы быть необоснованно, тупо редкими (настолько редкими, что мы ожидаем, что найти 0 синих машин на земле).
Так что, если мы изменим, насколько люди точны в описании цвета автомобиля? Конечно, мы могли бы довести это до крайности и сказать, что они делают это правильно только в 50% случаев, что не лучше, чем подбрасывание монеты. В этом случае задняя вероятность того, что машина синего цвета, просто равна предыдущей вероятности, потому что ответы людей ничего не сказали нам. Но, конечно, люди делают это, по крайней мере, немного лучше, и даже если мы говорим, что люди точны только в 51% случаев, отношение правдоподобия все равно получается таким, что вероятность того, что машина будет синей, примерно в раз больше ,1013
Это все результат довольно больших чисел, которые вы выбрали в своем примере. Если бы 9/10 человек сказали, что машина синего цвета, это была бы совсем другая история, даже если в одном лагере было одинаковое соотношение людей и других. Потому что статистические данные зависят не от этого соотношения, а от числовой разницы между противоборствующими группировками. Фактически, в соотношении правдоподобия (которое дает количественную оценку доказательств), 100 человек, которые говорят, что машина не синяя, в точности отменяют 100 из 900 человек, которые говорят, что она синяя, так что это так же, как если бы у вас было 800 человек, согласившихся это было голубое. И это, очевидно, довольно четкое доказательство.
(Редактировать: как указывал Silverfish , предположения, которые я здесь сделал, фактически подразумевали, что всякий раз, когда человек неправильно описывает не синий автомобиль, он по умолчанию говорит, что он синий. Конечно, это нереально, потому что он действительно может сказать любой цвет , и будет говорить «синий» только время от времени. Это не имеет никакого значения для выводов, поскольку, поскольку менее вероятно, что люди ошибочно примут не синий автомобиль за синий, тем сильнее будет доказательство того, что он синий, когда они говорят это. Так что, если что-нибудь, числа, приведенные выше, на самом деле являются только нижней границей на голубом свидетельстве.)