Мне нравятся модели Gaussian Mixture (GMM's).
Одна из их особенностей заключается в том, что в пробит-области они действуют как кусочные интерполяторы. Одним из следствий этого является то, что они могут действовать как основа замены, универсальный аппроксиматор. Это означает, что для негауссовых распределений, таких как логнормальные, вейбулловы или более сумасшедшие неаналитические, при условии соблюдения некоторых критериев - GMM может аппроксимировать распределение.
Поэтому, если вам известны параметры оптимального приближения AICc или BIC с использованием GMM, вы можете проецировать их на меньшие размеры. Вы можете повернуть его и посмотреть на главные оси компонентов аппроксимирующего GMM.
Следствием этого стал бы информативный и визуально доступный способ просмотра наиболее важных частей данных более высокого измерения с использованием нашего визуального восприятия в режиме трехмерного просмотра.
РЕДАКТИРОВАТЬ: (конечно, Whuber)
Есть несколько способов взглянуть на форму.
- Вы можете посмотреть на тенденции в средствах. Логнормальное значение аппроксимируется рядом гауссиан, что означает постепенное сближение, а вес которых уменьшается по мере развития. Сумма приближается к более тяжелому хвосту. В n-измерениях последовательность таких компонентов будет составлять лепесток. Вы также можете отслеживать расстояния между средними (преобразовать в большие измерения) и направлять косинусы между ними. Это приведет к гораздо более доступным измерениям.
- Вы можете создать трехмерную систему, осями которой являются вес, величина среднего и величина дисперсии / ковариации. Если у вас очень большое количество кластеров, это способ просмотреть их в сравнении друг с другом. Это ценный способ конвертировать 50k частей с 2k измерениями в несколько облаков в трехмерном пространстве. Я могу выполнить управление процессом в этом пространстве, если я выберу. Мне нравится рекурсия использования управления моделью гауссовой смеси на основе компонентов модели гауссовой смеси, соответствующих параметрам детали.
- С точки зрения устранения беспорядка вы можете выбросить очень маленький вес, или вес за ковариацию, или что-то подобное.
- р2
- Вы можете смотреть на это как на пузыри, пересекающиеся . Положение равной вероятности (нулевая дивергенция Кульбака-Лейблера) существует между каждой парой кластеров GMM. Если вы отслеживаете эту позицию, вы можете фильтровать по вероятности членства в этом месте. Это даст вам точки классификации границ. Это поможет вам изолировать «одиночки». Вы можете посчитать количество таких границ выше порогового значения для каждого члена и получить список «связности» для каждого компонента. Вы также можете посмотреть на углы и расстояния между локациями.
- Вы можете повторно сэмплировать пространство, используя случайные числа, заданные в гауссовых PDF-файлах, а затем выполнить основной анализ компонентов и посмотреть на собственные формы и собственные значения, связанные с ними.
РЕДАКТИРОВАТЬ:
Что означает форма? Они говорят, что специфика - это душа всего хорошего общения.
Что вы имеете в виду под "мерой"?
Идеи о том, что это может означать:
- Чувство нормального ощущения / ощущения общего вида. (чрезвычайно качественная, визуальная доступность)
- мера формы GD & T (копланарность, концентричность и т. д.) (чрезвычайно количественная)
- что-то числовое (собственные значения, ковариации и т. д.)
- полезная уменьшенная координата измерения (например, параметры GMM становятся размерами)
- система с пониженным шумом (сглажена некоторым образом, затем представлена)
Большинство из "нескольких способов" являются некоторыми вариациями на них.