У меня есть минимум, среднее значение и максимум некоторого набора данных, скажем, 10, 20 и 25. Есть ли способ:
создать распределение из этих данных, и
Существует бесконечное количество возможных распределений, которые соответствовали бы этим количествам образцов.
знать, какой процент населения, вероятно, лежит выше или ниже среднего
При отсутствии каких-то вероятных необоснованных предположений, а не в целом - по крайней мере, не слишком понимая, что это будет иметь смысл. Результаты будут в значительной степени зависеть от ваших предположений (в самих значениях не так много информации, хотя некоторые конкретные меры действительно дают некоторую полезную информацию - см. Ниже).
Нетрудно придумать ситуации, когда ответы на вопрос о пропорции могут быть очень разными. Когда есть очень разные возможные ответы в соответствии с информацией, как бы вы узнали, в какой ситуации вы находитесь?
Более подробная информация может дать полезные подсказки, но в нынешнем виде (даже без размера выборки, хотя, по-видимому, он равен как минимум 2 или 3, если среднее значение не находится на полпути между конечными точками *), вы не обязательно получите много значения в этом вопросе. , Вы можете попытаться получить границы, но во многих случаях они не будут сильно сужать вещи.
* на самом деле, если среднее значение близко к одной конечной точке, вы можете получить некоторую нижнюю границу размера выборки. Например, если вместо 10,20,25 для вашего минимального / среднего / максимального значения у вас будет 10 24 25, тогда должно быть не менее 15, и это также предполагает, что большая часть населения была старше 24; это что-то. Но если бы, скажем, 10,18,25, было бы гораздо сложнее получить полезное представление о том, каким может быть размер выборки, не говоря уже о пропорции ниже среднего.N