Проигнорируйте другие ответы здесь. На самом деле это вовсе не парадокс. Реальная проблема, которую все здесь игнорируют, заключается в том, что вы ошибаетесь, на какую вероятность вы действительно смотрите. На самом деле здесь действуют два совершенно разных средних и статистических показателя, которые имеют свои собственные применения и интерпретации в предложенном вами примере (маркетинг)!
Во-первых, это среднее количество продуктов, купленных на одного клиента. Таким образом, в среднем один покупатель покупает 1,6 товара. Конечно, клиент не может не иметь 0,6 продукта (при условии, что это не что-то вроде риса или зерна, которое имеет постоянное измерение, связанное с ним).
Во-вторых, есть среднее количество покупателей, которые покупают тот или иной товар. Звучит странно, правда? Таким образом, в среднем продукт имеет 5,33333333 ... покупатели покупают его. Это отличается однако. Здесь мы описываем не количество купленных продуктов (их всего три!), А количество людей, фактически покупающих указанный продукт.
Подумайте о двух значениях следующим образом: что бы представляли эти два значения, если бы был только один клиент или только один продукт? В конце концов, среднее значение для одной точки данных - это просто заданная точка данных.
Или, что еще лучше, подумайте о графике, как если бы он давал вам суммы в долларах, потраченные на покупку продукта. Очевидно, что средняя сумма, потраченная отдельным клиентом, будет намного меньше, чем сумма денег, сделанная в среднем продуктом, поставляемым крупной корпорацией (или даже небольшим бизнесом). Я уверен, что вы можете придумать хорошие способы использования обеих ценностей при обсуждении благополучия компании.
Когда вы будете объяснять это маркетологам, объясните им, как я сказал. Это не парадокс. Это просто совершенно другая статистика. Единственная проблема здесь заключалась в том, что было замечено, что на самом деле существует два разных способа чтения диаграммы (то есть количество людей, покупающих за продукт, против количества продуктов, купленных на человека).
tl; dr первое, что вы описали, - это средняя сумма, которую отдельный покупатель готов потратить на покупку вашей продукции. Второе - это средний спрос населения на данный продукт. Я уверен, что теперь вы понимаете, почему оба, безусловно, не одно и то же. Сравнение их как таковых просто даст вам мусорную информацию.
РЕДАКТИРОВАТЬ
Казалось бы, вопрос на самом деле задает вопрос о средних деньгах, потраченных клиентами, которые покупают какой-либо продукт a, b или c. Хорошо. На самом деле это просто ошибка в расчетах. Я бы не назвал это парадоксом. Это на самом деле просто тонкий вздор.
Посмотри на свои колонки. Есть люди, которые разделяются между столбцами. Давайте предположим, что вы сделали правильное средневзвешенное значение. Вы все еще складываете людей дважды. Это означает, что среднее будет содержать дополнительных людей со значением, большим или равным 2. Теперь, каково было ваше среднее значение? Это было 1.6! По сути, ваш средний выглядит так:
∑ni=0valueOfPersoni∗valueOfPersonin
Это определенно не правильная формула. Это средневзвешенное значение, хотя и допускающее взаимную исключительность, то есть то, как вы бы приспособились, чтобы получить истинное среднее в вашей ситуации.
∑ni=0numberOfPeopleBuyingi∗averageSpentByPersonBuyingin
В любом случае вы получите среднюю ошибку. Одной из ошибок было игнорирование необходимости взвешенного среднего, поскольку одна категория имеет больший «вес» с точки зрения среднего. Это как плотность. Одно значение плотнее в людях представляет. Другая проблема - дублирование, которое искажает среднее значение. Я не называю ни один из этих "парадоксов" все же. Когда я увидел, что ты делаешь, для меня стало очевидным, почему это не сработает. Средневзвешенное значение самоочевидно для его потребности, и теперь я думаю, что вы видите, что вы добавили значения несколько раз ... это не может работать. Вы в основном взяли среднее значение квадратов их значений.