Одним из вариантов является получение частот всех комбинаций покупок товара; выберите несколько наиболее распространенных комбинаций; затем построите регрессионную модель, чтобы предсказать выбранную комбинацию каждого человека. Например, с помощью бинарной логистической регрессии вы могли бы предположить, что вы приобретете: а) белое вино, бри, клубнику и виноград против б) красное вино, чеддер и гауда. При наличии более двух таких комбинаций или если вы хотите включить категорию «ни один из вышеперечисленных», полиномиальная логистическая регрессия, вероятно, будет предпочтительным методом.
Обратите внимание, что включение только общих комбинаций означает, что у вас будет больше выполнимых номеров каждого, но вы будете исключать другие, по крайней мере, из этой процедуры. Я мог бы представить 7 предметов, создающих десятки комбо, каждое из которых было выбрано как минимум несколькими людьми. Возможно, это слишком много категорий для вашего размера выборки. Более того, если комбо выберут всего несколько человек, ваша модель будет иметь очень мало информации для работы.
Другой вариант - использовать кластерный анализ, чтобы получить несколько наборов товаров, которые обычно покупаются вместе. С 7 предметами вы, вероятно, получите менее 4 кластеров, которые могут упростить вашу задачу. Если вы попробуете кластерный анализ и обнаружите, что результаты неработоспособны, то нет причин, по которым вы должны их использовать: просто вернитесь к частотному подходу, описанному выше. В этом случае, если я вас правильно прочитал, вы ищете наиболее описательный и интересный массив категорий, и при установлении этого вам не нужно беспокоиться о степенях свободы, множественных сравнениях или любых подобных проблемах, которые могут иметь место. если вы пытались несколько методов при выполнении какого-то логического теста.