Я пытаюсь отделить две группы значений из одного набора данных. Я могу предположить, что одна из популяций обычно распределена и составляет не менее половины размера выборки. Значения второго значения ниже или выше значений первого (распределение неизвестно). То, что я пытаюсь сделать, - это найти верхний и нижний пределы, которые бы охватывали нормально распределенное население от другого.
Мое предположение дает мне отправную точку:
- все точки в пределах межквартильного диапазона образца взяты из нормально распределенной популяции.
Я пытаюсь проверить выбросы, отбирая их из остальной части выборки, пока они не вписываются в 3-е число в нормально распределенной популяции. Что не идеально, но, кажется, дает достаточно разумный результат.
Является ли мое предположение статистически обоснованным? Что может быть лучше для этого?
ps пожалуйста исправьте теги кого-то.