Если 900 из 1000 человек говорят, что машина синего цвета, какова вероятность того, что она синего цвета?


114

Первоначально это возникло в связи с некоторой работой, которую мы проводим с моделью для классификации естественного текста, но я упростил ее ... Возможно, слишком много.

У вас есть синяя машина (по некоторым объективным научным показателям - она ​​синяя).

Вы показываете это до 1000 человек.

900 говорят, что это синий. 100 нет.

Вы даете эту информацию тому, кто не видит машину. Все, что они знают, это то, что 900 человек сказали, что это синий, а 100 - нет. Вы больше ничего не знаете об этих людях (1000).

Исходя из этого, вы спрашиваете человека: «Какова вероятность того, что машина синего цвета?»

Это вызвало огромное расхождение во мнениях среди тех, кого я спросил! Каков правильный ответ, если он есть?


162
Интересно, какие будут ответы, если вы смените машину на платье ?
user1717828

13
Так в чем вопрос людям? "Машина синяя?" или "Какого цвета машина?"
Kon псих

13
Что значит для машины синий цвет? Если некоторые люди говорят, что машина не синего цвета, то вполне вероятно, что это цвет, который некоторые люди называют синим, а другие называют другим именем. Это не означает, что они не согласны с цветом, это означает, что они не согласны с названием цвета.
Бен

7
Я думаю, что этот вопрос значительно улучшился бы, если бы вы дали разные расходящиеся мнения. В нынешнем виде ответы могут просто исследовать всю область, от теории вероятностей до теории цвета или даже биологии (дальтонизм), и я не понимаю, как это действительно поможет вам.
17

32
В описании проблемы чего-то не хватает. 100 человек, отрицающих, что машина синяя, когда она, безусловно, синяя, - это много людей, вы не можете просто отбросить их как случайные ошибки.
Аксакал

Ответы:


117

TL; DR: Если вы не предполагаете, что люди неоправданно плохо оценивают цвет автомобиля, или что синие автомобили неоправданно редки, большое количество людей в вашем примере означает, что вероятность того, что машина синего цвета, в основном равна 100%.

Мэтью Друри уже дал правильный ответ, но я просто хотел бы добавить к этому несколько числовых примеров, потому что вы выбрали свои числа так, что вы на самом деле получаете довольно похожие ответы для широкого диапазона различных настроек параметров. Например, предположим, как вы сказали в одном из ваших комментариев, что вероятность того, что люди правильно оценивают цвет автомобиля, составляет 0,9. То есть: а также p ( скажем, это не синий | автомобиль не синий ) = 0,9

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

Определив это, мы должны решить следующее: какова вероятность того, что машина синего цвета? Давайте выберем очень низкую вероятность, просто чтобы посмотреть, что произойдет, и скажем, что , то есть только 0,1% всех автомобилей синего цвета. Тогда задняя вероятность того, что машина синего цвета, может быть рассчитана как:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0,999

Если вы посмотрите на знаменатель, то вполне ясно, что второй член в этой сумме будет пренебрежимо мал, поскольку в относительном размере членов в сумме преобладает отношение от до 0,1 900 , что составляет порядка 10 58 . И действительно, если вы выполните этот расчет на компьютере (стараясь избежать проблем с недостаточным количеством), вы получите ответ, равный 1 (с точностью до машины).0.99000,19001058

Причина, по которой предыдущие вероятности на самом деле не имеют большого значения, заключается в том, что у вас есть так много доказательств одной возможности (машина синего цвета) по сравнению с другой. Это может быть количественно определено отношением правдоподобия , которое мы можем рассчитать как:

п(ответы|машина синего цвета)п(ответы|машина не синяя)знак равно0.9900×0,11000,1900×0.910010+763

Таким образом, даже прежде, чем рассматривать предыдущие вероятности, фактические данные предполагают, что один вариант уже астрономически более вероятен, чем другой, и для предыдущего, чтобы иметь какое-либо значение, синие автомобили должны были бы быть необоснованно, тупо редкими (настолько редкими, что мы ожидаем, что найти 0 синих машин на земле).

Так что, если мы изменим, насколько люди точны в описании цвета автомобиля? Конечно, мы могли бы довести это до крайности и сказать, что они делают это правильно только в 50% случаев, что не лучше, чем подбрасывание монеты. В этом случае задняя вероятность того, что машина синего цвета, просто равна предыдущей вероятности, потому что ответы людей ничего не сказали нам. Но, конечно, люди делают это, по крайней мере, немного лучше, и даже если мы говорим, что люди точны только в 51% случаев, отношение правдоподобия все равно получается таким, что вероятность того, что машина будет синей, примерно в раз больше ,1013

Это все результат довольно больших чисел, которые вы выбрали в своем примере. Если бы 9/10 человек сказали, что машина синего цвета, это была бы совсем другая история, даже если в одном лагере было одинаковое соотношение людей и других. Потому что статистические данные зависят не от этого соотношения, а от числовой разницы между противоборствующими группировками. Фактически, в соотношении правдоподобия (которое дает количественную оценку доказательств), 100 человек, которые говорят, что машина не синяя, в точности отменяют 100 из 900 человек, которые говорят, что она синяя, так что это так же, как если бы у вас было 800 человек, согласившихся это было голубое. И это, очевидно, довольно четкое доказательство.

(Редактировать: как указывал Silverfish , предположения, которые я здесь сделал, фактически подразумевали, что всякий раз, когда человек неправильно описывает не синий автомобиль, он по умолчанию говорит, что он синий. Конечно, это нереально, потому что он действительно может сказать любой цвет , и будет говорить «синий» только время от времени. Это не имеет никакого значения для выводов, поскольку, поскольку менее вероятно, что люди ошибочно примут не синий автомобиль за синий, тем сильнее будет доказательство того, что он синий, когда они говорят это. Так что, если что-нибудь, числа, приведенные выше, на самом деле являются только нижней границей на голубом свидетельстве.)


11
+1. Фактически, учитывая данные OP, оценка MLE того, насколько часто люди точны, составляет 900/1000 = 90%.
амеба

5
Получение правильного цвета автомобиля в 50% случаев - это не то же самое, что подбрасывание монеты. В конце концов, существует не только два доступных цвета. Кроме того, может быть, некоторые говорят «военно-морской флот» или «лазурь» вместо «синий»? На самом деле, люди из числа майн ошибочно скажут «синий», если правильным ответом будет «какой-то причудливый и модный запатентованный цвет, почти похожий на синий»
Хаген фон

10
Я знаю, что это только иллюстративные цифры, но если «вероятность того, что люди правильно оценивают цвет автомобиля, составляет 0,9», то, если в синем цвете нет ничего особенного, я не думаю, что разумно утверждать p (скажем, это синий | машина не синяя) = 0.1. Если мы считаем, что в 90% случаев люди идентифицируют правильный цвет, то p (скажем, красный | автомобиль - красный) = p (скажем, белый | автомобиль - белый) = p (скажем, зеленый | автомобиль - зеленый) = 0,9 и т. Д. на все возможные цвета автомобиля. Но почему р (скажем, синий | автомобиль красный) = р (скажем, синий | автомобиль белый) = р (скажем, синий | автомобиль зеленый) = 0,1? Это подразумевает, например, р (скажем, белый | автомобиль красный) = 0.
Серебряная

2
@PatMolloy: не обязательно. Это зависит от того, симметричны ли вероятности: одинаково ли вероятно, что кто-то ошибочно принимает синий цвет за не синий автомобиль, поскольку он ошибочно принимает синий за синий автомобиль? Если так, то вердикт 500/500 дает столько же информации, сколько бросок монеты. Но если люди с меньшей вероятностью скажут, что синяя машина не синяя, чем те, кто скажет, что синяя машина не синяя, то 500 сине-говорящих труднее объяснить, чем 500 не сине-говорящих. не синяя гипотеза. Так что в этом случае баланс доказательств сместится в сторону синего цвета.
Рубен ван Берген

3
Восприятие цвета - хитрая вещь ... если девять из десяти людей говорят, что платье белое и золотое, какова вероятность того, что оно голубое и черное?
Glen_b

73

Правильный ответ зависит от информации, не указанной в задаче, вам придется сделать еще несколько предположений, чтобы получить единый окончательный ответ:

  • Предварительная вероятность того, что машина синего цвета, т. Е. Ваша вера в то, что машина синего цвета, вы еще никого не спрашивали.
  • Вероятность того, кто - то говорит вам , что автомобиль синего цвета , когда он на самом деле является синий, и вероятность того, что они говорят вам автомобиль синего цвета , когда он на самом деле не синий.
  • Вероятность того, что автомобиль на самом деле синий, когда кто-то говорит, что он есть, и вероятность того, что автомобиль не синий, когда кто-то говорит, что это синий.

С помощью этих частей информации мы можем разбить все это с помощью формулы Байеса, чтобы получить последующую вероятность того, что автомобиль синего цвета. Я сконцентрируюсь на случае, когда мы спрашиваем только одного человека, но те же аргументы могут применяться к случаю, когда вы спрашиваете человек.1000

ппоsT(машина синего цвета)знак равноп(машина синего цвета|скажи синий)п(скажи синий)    +п(машина синего цвета|скажи не синий)п(скажи не синий)

п(скажи синий)

п(скажи синий)знак равно п(скажи синий|машина синего цвета)ппряор(машина синего цвета)+п(скажи синий|машина не синяя)ппряор(машина не синяя)

Итак, два применения правила Байеса помогут вам в этом. Вам нужно будет определить неопределенные параметры, основываясь либо на имеющейся у вас информации о конкретной ситуации, либо на основе некоторых разумных предположений.

Есть несколько других комбинаций предположений, которые вы можете сделать, основываясь на:

п(скажи синий|машина синего цвета)п(машина синего цвета)знак равноп(машина синего цвета|скажи синий)п(скажи синий)

С самого начала вы не знаете ничего из этого. Таким образом, вы должны сделать некоторые разумные предположения о трех из них, а затем определить четвертое оттуда.


5
Это часто бывает. Тогда у вас есть два варианта, выразите свое полное отсутствие знаний, предполагая, что синий, а не синий одинаково вероятны. Сделайте быстрый обзор поля, что-то вроде этого может помочь: en.wikipedia.org/wiki/Car_colour_popularity
Matthew Drury

18
@ Математика: проблема с «синим, а не синим одинаково вероятна» заключается в том, что оно несовместимо; если мы применяем одинаковые рассуждения к каждому из возможных цветов автомобиля, мы получаем утверждение, что все они имеют одновременно 50% -ную вероятность (невозможно с более чем двумя цветами по законам вероятности) и менее 50% -ную вероятность (когда вы посмотрите на синий в «не белом» и «не красном», что также приводит к противоречиям, так как вероятность любого цвета не может принимать несколько значений)
Glen_b

2
Существует больше неопределенной информации, чем эта, потому что ответы людей не должны быть независимыми (на самом деле, мы надеемся, что они сильно коррелируют с объективным цветом, а следовательно, далеки от независимости). Что, если ответы «чрезмерно» зависимы? Скажем, мы просто спрашиваем десять случайных пешеходов, но каждый из них отвечает по 100 раз?
Хаген фон

2
п(Джо и Мэри говорят синий|машина синего цвета)знак равноп(Джо говорит синий|машина синего цвета)п(Мэри говорит синий|машина синего цвета)

15
@Glen_b: в мире есть только два цвета, синий и не синий. По общему признанию оба входят во множество оттенков, особенно не синий.
psmears

13

Есть важное предположение, что ваши 1000 мнений не разделяют систематический уклон. Что является разумным предположением здесь, но может быть важным в других случаях.

Примеры могут быть:

  • все они имеют одинаковую дальтонизм (например, генетика в популяции),
  • они все видели машину ночью под оранжевым натриевым уличным освещением,
  • все они разделяют общую культуру, в которой синий цвет является табу или магически связан (что указывает на то, описывают ли они какой-либо объект как синий или используют культурный эвфемизм или что-то еще),
  • им всем сказали (или они разделяют общее убеждение), что если они ответят / не ответят определенным образом, с ними произойдет что-то хорошее / плохое .....

В этом случае это маловероятно, но в других случаях это подразумеваемое предположение. Это также не должно быть настолько экстремально - перенесите ваш вопрос в какую-то другую область, и это будет реальным фактором.

Примеры для каждого, где ваш ответ может зависеть от общего смещения:

  • спросите, вмещает ли высокий тонкий стакан больше, чем фактически идентичный короткий толстый стакан, но ваши 1000 респондентов очень маленькие дети (общее неправильное восприятие).
  • спросите 1000 человек, опасно ли ходить под лестницей (распространенное культурное убеждение)
  • спросите 1000 состоящих в браке людей, любят ли они своего партнера / имели ли дело, в обстоятельствах, когда они полагают, что их партнер узнает об их ответе. Контекстом может быть телешоу или присутствие партнера по запросу и т. Д. (Общее мнение о последствиях)

Нетрудно представить некоторые структурно идентичные вопросы, где ответ 900: 100 был мерой убеждений и честности или чего-то еще, и не указывает на правильный ответ. В этом случае маловероятно, но в других случаях - да.


11

Одна из причин, по которой вы получаете разные ответы от разных людей, заключается в том, что вопрос можно интерпретировать по-разному, и неясно, что вы подразумеваете под «вероятностью» здесь. Один из способов разобраться в этом вопросе - назначить приоры и причину, используя правило Байеса, как в ответе Мэтью.

Прежде чем спрашивать о вероятностях, вы должны решить, что моделируется как случайное, а что нет. Общепризнанно, что неизвестным, но фиксированным количествам должны назначаться априорные значения. Вот эксперимент, аналогичный вашему, который подчеркивает проблему с вопросом:

Иксяязнак равно1,...,1000пзнак равно0,5ИксяΣязнак равно11000Иксязнак равно900

пп


1
Итак, если вы удалите предположение, что машина синего цвета, а остальное такое же, 900 человек говорят, что синий, а 100 говорят, что нет, в таком случае вероятность будет 0,9?
пользователь

Нет, это намного ближе к 1. Очень, очень маловероятно, что 900 из 1000 человек получат неправильный цвет.
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.это не соответствует пониманию «вероятности», как я с ней знаком. Это звучит как «X может случиться или не произойти, поэтому вероятность должна быть 50%». Можете ли вы прояснить, что вы подразумеваете под этим предложением?
AnoE

2
@ Нет, различие аналогично различию между параметрами и случайными величинами. В постановке вопроса дается, что машина на самом деле синего цвета, ее цвет не является результатом случайного эксперимента. По сути, это интерпретация против Байеса. Если вы подбрасываете монету 1000 раз и наблюдаете 900 голов, то какова вероятность, что монета справедлива? Это либо единица, либо ноль, если вы частый (или бессмысленный); мы не назначаем вероятности параметрам.
ekvall

@ Пользователь Нет, я обновил ответ, чтобы прояснить мою точку зрения.
ekvall

7

Простой практический ответ:

Вероятность может легко варьироваться от 0% до 100% в зависимости от ваших предположений

Хотя мне действительно нравятся существующие ответы, на практике все сводится к двум простым сценариям:

Сценарий 1: Предполагается, что люди очень хорошо распознают синий, когда он синий ... 0%

В этом случае так много людей заявляют, что машина не синего цвета, поэтому маловероятно, что машина на самом деле синего цвета. Следовательно, вероятность приближается к 0%.

Сценарий 2: Предполагается, что люди очень хорошо распознают не синий, когда он не синий ... 100%

В этом случае так много людей заявляют, что машина синего цвета, и очень вероятно, что она действительно синего цвета. Следовательно, вероятность приближается к 100%.


Конечно, подойдя к этому с математической точки зрения, вы начнете с чего-то общего, типа «давайте предположим, что соответствующие вероятности ...», что совершенно бессмысленно, поскольку такие вещи обычно не известны ни при каких случайных обстоятельствах. Поэтому я призываю смотреть на крайности, чтобы понять идею, что оба процента могут быть легко оправданы простыми и реалистичными предположениями, и что поэтому нет единого значимого ответа.


2
Если «предполагается, что люди очень хорошо распознают синий», почему они считают, что это синий, когда его нет в сценарии 1? Возможно, вы захотите выразить свои сценарии в терминах ложных позитивов и ложных негативов.
Hyde

@hyde Переписал сценарии, чтобы убрать двусмысленность
Деннис Джаэруддин


5

Вам необходимо разработать некоторые рамки оценки. Некоторые вопросы, которые вы можете задать:

  1. Сколько здесь цветов? Мы говорим о двух цветах? Или все цвета радуги?

  2. Насколько различны цвета? Мы говорим синий и оранжевый? Или синий, голубой и бирюзовый?

  3. Что значит быть синим? Голубой и / или бирюзовый? Или просто синий?

  4. Насколько хороши эти люди в оценке цвета? Все ли они графические дизайнеры? Или они дальтоники?

С чисто статистической точки зрения мы можем сделать некоторые предположения относительно последнего. Во-первых, мы знаем, что как минимум 10% людей выбирают неправильный ответ. Если есть только два цвета (из первого вопроса), то можно сказать, что есть

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

В качестве быстрой проверки, если мы сложим их вместе, мы получим 100%. Вы можете увидеть более математическую запись этого в ответе @MatthewDrury .

Как мы получаем 90% в третьем? Это то, как много людей сказали синий, но были неправы, если это не так. Поскольку есть только два цвета, они симметричны. Если бы было больше двух цветов, то вероятность того, что неправильный выбор будет синим, когда они сказали что-то еще, была бы ниже.

В любом случае, этот метод оценки дает нам 90% синего цвета. Это включает в себя 81% вероятность того, что люди скажут синий, когда это так, и 9% вероятность того, что люди скажут, что это не так, когда это так. Это, вероятно, самое близкое к тому, что мы можем прийти к ответу на первоначальный вопрос, и это требует от нас полагаться на данные, чтобы оценить две разные вещи. И предположить, что вероятность выбора синего цвета совпадает с вероятностью правильного выбора синего цвета.

Если есть более двух цветов, то логика немного изменится. Первые две строки остаются прежними, но мы теряем симметрию в последних двух строках. В этом случае нам нужно больше информации. Мы можем предположить, что вероятность правильного произнесения синего снова равна 81%, но мы понятия не имеем, какова вероятность того, что цвет синий, когда кто-то говорит, что это не так.

Мы могли бы также улучшить даже двухцветную оценку. Учитывая статистически значимое количество автомобилей каждого цвета, мы могли бы видеть статистически значимое количество людей и классифицировать их. Тогда мы могли бы посчитать, как часто люди правы, когда они делают выбор каждого цвета, и как часто они правы для каждого выбора цвета. Тогда мы могли бы более точно оценить фактический выбор людей.

Вы можете спросить, как 90% могут ошибаться. Подумайте, что произойдет, если есть три цвета: лазурный, синий и сапфировый. Кто-то может обоснованно считать, что все три из них голубые. Но мы хотим большего. Мы хотим точный оттенок. Но кто помнит названия других оттенков? Многие могут угадать синий, потому что это единственный подходящий оттенок, который они знают. И все же ошибаться, когда он окажется лазурным.


Как упомянуто в одном из предыдущих комментариев, безусловно, только два соответствующих цвета являются «синим» и «не синим», поэтому часть о нескольких цветах не должна быть необходима.
Деннис Джаэруддин

4

Точное, математическое, истина / ложь вероятность не может быть вычислена с помощью информации , которую вы предоставляете.

Однако в реальной жизни такая информация никогда не бывает достоверной. Поэтому, используя нашу интуицию (и куда бы ушли все мои деньги, если бы мы ставили), машина определенно синего цвета. (некоторые считают, что это больше не статистика, но хорошо, черно-белые взгляды на науку не очень помогают)

Аргументация проста. Предположим, машина не синяя. Тогда 90% людей (!) Были неправы. Они могут ошибаться только из-за списка проблем, в том числе:

  • дальтоник
  • патологическая ложь
  • находясь под воздействием таких веществ, как алкоголь, ЖК-дисплей и т. д.
  • не понимая вопроса
  • другая форма психического расстройства
  • сочетание вышеперечисленного

Поскольку вышеперечисленное явно не может повлиять на 90% средней случайной популяции (например, дальтонизм затрагивает около 8% мужчин и 0,6% женщин, то есть 43 человека из 1000), автомобиль обязательно должен быть синий. (То есть все мои деньги пошли бы в любом случае).


Это кажется интуитивно правильным для меня. Я думаю, что критика исходного вопроса заключается в том, что он не дает достаточно информации и что необходимо сделать определенные предположения ... ну, разве это не всегда так в реальном мире ???
Пэт Моллой

@PatMolloy Это не дает достаточно информации, чтобы предоставить точный правильный / неправильный сложный математический ответ (это, безусловно, то, что многие вопросы стремятся получить с этого сайта). Однако, учитывая предоставленную вами сокращенную информацию, когда речь идет о ставках на деньги, именно этот ответ (100%) люди выберут.
Лучоначо

1
Я думаю, что вы не смогли охватить некоторые из наиболее вероятных альтернатив, которые должны заставить вас изменить свое заключение. К ним относятся (а) люди не могут распознать синий; (б) отсутствует общее понимание «синего» между спрашивающим и респондентами; (в) «научное» значение «синий» отличается от того, что люди обычно понимают как «синий». Важно отметить, что, поскольку вы не можете дать количественную оценку ни одной из этих альтернатив, ни большинству из перечисленных вами, как вы можете обосновать количественную оценку вероятности ответа? Это не статистика!
whuber

«Поскольку вышеизложенное явно не может повлиять на 90% среднего случайного населения», не будьте так уверены в этом. Помните, что мы обычно говорим в терминах средних значений при обсуждении людей. Так что, конечно, только несколько процентов имеют дальтонизм (по сравнению со средним), но может быть несколько человек с превосходным зрением, например, тетрахроматы.
NPSF3000

2
Я всегда под влиянием LCD
Alex

2

Я бы не стал есть фекалии, основываясь на том факте, что миллиард мух не может ошибаться. Могут быть десятки других причин, по которым 900 человек из 1000 могли быть обмануты, считая, что машина синего цвета. В конце концов, это основа магических трюков, заставляющих людей думать, что они удалены от реальности. Если 900 человек из 1000 увидят мага, наносящего удар его / ее помощнику, они быстро ответят, что ассистенту был нанесен удар, за то, как невероятное убийство произошло на сцене. Синий свет на отражающей автомобильной краске, кто-нибудь?


2

Опрашивающий слишком мало знает о том, как проводился опрос, чтобы точно ответить на вопрос. Насколько он обеспокоен, опрос может пострадать от нескольких проблем:

Люди, принимающие участие в опросе, могли быть предвзятыми:

  1. Машина выглядела синей из-за оптического обмана .

  2. По какой-то причине было трудно наблюдать за цветом машины, и людям по какой-то причине было показано много синих автомобилей до этой, заставляя большинство из них полагать, что эта машина, вероятно, тоже была синей.

  3. Вы заплатили им, чтобы сказать, что машина синего цвета.

  4. Вы заставили кого-то загипнотизировать их всех, поверив, что машина синего цвета.

  5. Они заключили договор, чтобы лгать и саботировать опрос.

Возможно, были корреляции среди людей, принимающих участие в опросе, из-за того, как они были выбраны или потому, что они влияли друг на друга:

  1. Вы случайно провели опрос на митинге для людей с такой же дальтонизмом.

  2. Вы провели опрос в детских садах; девочки не интересовались машиной, и большинство мальчиков предпочитали синий цвет, заставляя их думать, что машина синяя.

  3. Первый человек, которому показали автомобиль, был пьян и подумал, что он выглядел синим, крикнул «ЭТО СИНИЙ», заставляя всех думать, что машина синего цвета.

Таким образом, в то время как вероятность того, что машина синего цвета, если опрос был проведен полностью правильно, чрезвычайно высока (как объяснено в ответе Рубена ван Бергена), надежность опроса могла быть скомпрометирована, что делает вероятность того, что машина не синего цвета, не незначительный. Насколько велик вопросник, который оценивает этот шанс, в конечном счете, зависит от его оценок вероятности того, что обстоятельства опровергли опрос, и того, насколько вы хороши в проведении опросов (и насколько он озорной, по вашему мнению, вы).


2

Какое определение для "blue"?

Разные культуры и языки имеют разные понятия синего цвета. IIRC, некоторые культуры включают зеленый в свое понятие о синем!

Как и любое слово на естественном языке, вы можете только предполагать, что существует некоторое культурное соглашение о том, когда (а когда нет) называть вещи «голубыми».

В целом, цвет в языке удивительно субъективен (ссылка из комментариев ниже, спасибо @Count Ibilis)

введите описание изображения здесь


7
В контексте вопроса, я полагаю, что этот конкретный аспект довольно не имеет значения - я предполагаю, что ФП выбрало слово «синий» в качестве очень общего термина, а не что-то вроде «лазурный», «torqouise» и т. Д., Где люди могут быть не уверены. Кроме того, автомобили обычно имеют тенденцию использовать очень ограниченную палитру возможных / обычных цветов. Наконец, вопрос не в том, «почему 100 человек сказали, что они не голубые», а в том, «какова вероятность того, что автомобиль на самом деле синий».
17


Точное определение будет «излучать свет преимущественно с длиной волны 475 нм плюс минус 10-20 нм в современных условиях окружающей среды». Это обычно считается синим цветом.
rackandboneman

Да, но сколько людей носят с собой инструмент для измерения преобладающей длины волны? Вы также забыли исключить невидимые длины волн.
Anony-Mousse

1
Похоже, вопрос касается использования группы людей с неизвестной калибровкой статистически в качестве измерителя длины волны :)
rackandboneman

1

Вероятность, в зависимости от более изощренных предварительных условий, может составлять несколько различных значений, но 99,995% - это то, что имеет для меня наибольшее значение.

Мы знаем, по определению, что машина синего цвета (это 100%), но не совсем точно указано, что это на самом деле означает (это может быть несколько философски). Я предполагаю, что что-то синее в смысле «действительно можно увидеть как синий».

Мы также знаем, что 90% испытуемых сообщили, что это синий цвет.

Мы не знаем, что спросили или как была проведена оценка, и в каких условиях освещения находился автомобиль. Когда кого-то попросили назвать цвет, некоторые субъекты могли бы, например, сказать «зеленовато-синий» из-за условий освещения, и эксперт мог не засчитали это как "синие". Те же люди могли бы ответить «да», если бы вопрос был «Это синий?». Я предполагаю, что вы не собирались злонамеренно обманывать своих подопытных.

Мы знаем, что частота тританопии составляет около 0,005%, что означает, что, если автомобиль действительно можно увидеть синим , то 99,995% испытуемых действительно видели синий цвет. Это, однако, означает, что 9,995% испытуемых не сообщили о синем, когда они ясно видели синий. Они лгали о том, что видели. Это также близко к тому, что говорит вам ваш жизненный опыт: люди не всегда честны (но, если нет мотива, они обычно так и есть).

Таким образом, не наблюдающий человек может с абсолютной уверенностью предположить, что машина синего цвета. Это было бы 100%

За исключением ... кроме случаев, когда сам человек, не наблюдающий, страдает от тританопии, и в этом случае она не увидит машину синего цвета, хотя все остальные (точнее, 90% из них) так и говорят. Здесь это снова становится философским: если все слышали, как упало дерево, а я нет, упало ли оно?

Я полагаю, что наиболее разумный, практический ответ будет таким: если не наблюдающий человек окажется трианопом (вероятность 0,005%), то проверка того, являются ли предсказанный цвет и реальный видимый цвет одинаковыми, приведет к ложному результату. Таким образом, вероятность составляет 99,995%, а не 100%.

Кроме того, в качестве бонуса, поскольку мы выяснили, что 9,995% испытуемых являются лжецами, и известно, что все критяне лжецы , мы можем заключить, что мы не на Крите!


1

У вас есть синяя машина (по некоторым объективным научным показателям - она ​​синяя).

...

"Какова вероятность того, что машина синего цвета?"

Это 100% синий.

Все, что они знают, это то, что 900 человек сказали, что это синий, а 100 - нет. Вы больше ничего не знаете об этих людях (1000).

Использование этих чисел (без какого-либо контекста) - полная чушь. Все сводится к личной интерпретации вопроса. Мы не должны идти по этому пути и использовать слова Витгенштейна: «Wovon man nicht sprechen kann, darüber muss man schweigen».


Представьте себе следующий вопрос для сравнения:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

Это в основном та же самая проблема (без информации), но гораздо более ясно, что то, что мы думаем о цвете автомобиля, в основном (если не полностью) косвенно.


В конечном итоге, когда мы получим несколько связанных вопросов, мы сможем начать угадывать ответы на такие неполные вопросы. То же самое относится и к алгоритму «око за око», который не работает ни в одном случае, но работает в долгосрочной перспективе . В том же смысле Витгенштейн вернулся из своей предыдущей работы с его основными исследованиями . Мы можем ответить на эти вопросы, но нам нужно больше информации / испытаний / вопросов. Это процесс.


0

Если мы предположим, что машина синего цвета, то 100 из 1000, говорящих, что это не синий цвет, подразумевают какое-то предельное смещение выборки. Возможно, вы выбирали только дальтоников. Если предположить, что машина не синего цвета, то смещение выборки еще хуже. Итак, все, что мы можем сделать вывод из приведенных данных, это то, что выборка очень предвзята, и, поскольку мы не знаем, как она была предвзятой, мы не можем ничего сделать о цвете автомобиля.


Хм, конечно, тот факт, что 900 человек сказали, что это синий, это хорошо для чего-то? Разве мы не можем сделать вывод, что это скорее синий, чем нет ?? Помните, что респондент знает только цифры 900 и 100. Значит, они действительно могут что-то сказать о предвзятости?
Пэт Моллой

0

Там было несколько ответов. Я ни в коем случае не гуру математики, но вот мой.

Возможны только 4 варианта:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

Из вопроса вы знаете, что сумма случая 1 и случая 4 составляет 900 человек (90%), а сумма случая 2 и случая 3 составляет 100 человек (10%). Однако здесь есть одна загвоздка: то, что вы не знаете, это распределение в этих двух парах случаев. Возможно, сумма случаев 1 и 4 полностью состоит из случая 1 (что означает, что автомобиль синего цвета), или, возможно, вся сумма состоит из случая 4 (что означает, что автомобиль не синего цвета). То же самое касается суммы случая 2 + 3. Итак ... Вам нужно найти способ предсказать распределение в пределах сумм. Без других указаний в этом вопросе (нигде не сказано, что люди на 80% уверены, что знают свои цвета или что-то в этом роде), вы не сможете придумать определенный, определенный ответ.

Сказав это ... я подозреваю, что ожидаемый ответ что-то вроде:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

где оставшиеся 50% просто неизвестны, назовите это допустимой ошибкой.


0

Икс,Y1,Y2,...,Y1000{0,1}1п(Икс)пИксYя|Иксзнак равно1п1Yя|Иксзнак равно0п0θзнак равно(пИкс,п0,п1)

п(θ,Икс|Y1:1000)αп(θ)п(Икс|θ)Πязнак равно11000п(Yя|Икс)

{Икся}{Yя|Икс}


-3

Человек, который не может видеть машину, не знает, что она синего цвета. Вероятность того, что машина синего цвета, равна 50/50 (синего цвета или нет). Опрос других людей может повлиять на мнение этого человека, но это не меняет вероятности того, что невидимая машина либо синего цвета, либо нет.

Все вышеприведенное математическое вычисление определяет вероятность того, что ваш набор образцов может определить, является ли он синим.


Я не уверен, что это правда, что вероятность того, что это синий, равна 50/50. На самом деле, он меньше 50, так как он может быть красным, белым, желтым и т. Д. Вероятность того, что выбранная машина синего цвета, намного меньше 50%.
пользователь
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.