Это и искусство, и наука. Типичные области исследования вращаются вокруг анализа корзины рынка (также называемого анализом сходства), который является подмножеством области интеллектуального анализа данных. Типичные компоненты в такой системе включают в себя идентификацию основных предметов драйвера и идентификацию сходных предметов (дополнительное оборудование, перекрестная продажа).
Имейте в виду источники данных, которые они должны добывать ...
- Приобретенные корзины покупок = реальные деньги от реальных людей, потраченные на реальные товары = мощные данные и многое из этого.
- Предметы добавлены в тележки, но заброшены.
- Ценовые эксперименты онлайн (A / B-тестирование и т. Д.), В которых они предлагают одни и те же продукты по разным ценам и видят результаты
- Эксперименты по упаковке (A / B-тестирование и т. Д.), В которых они предлагают разные товары в разных «связках» или скидку на разные пары товаров
- Списки пожеланий - что на них написано специально для вас - и в совокупности их можно обрабатывать аналогично другому потоку данных анализа корзины
- Сайты рефералов (идентификация того, откуда вы пришли, может подсказать другие интересующие вас объекты)
- Время ожидания (как долго, прежде чем вы нажмете назад и выберите другой элемент)
- Рейтинги, сделанные вами или теми, кто находится в вашей социальной сети / кругах покупателя - если вы оцениваете понравившиеся вам вещи, вы получаете больше того, что вам нравится, и если вы подтверждаете кнопкой «У меня уже есть это», они создают очень полный профиль вас
- Демографическая информация (ваш адрес доставки и т. Д.) - они знают, что популярно в вашем регионе для ваших детей, вас, вашего супруга и т. Д.
- Сегментация пользователя = Вы купили 3 книги в отдельные месяцы для малыша? скорее всего есть ребенок или больше .. и т. д.
- Прямой маркетинг кликает по данным - вы получили от них электронную почту и кликнули? Они знают, какое это было электронное письмо, на что вы нажали и купили ли вы его в результате.
- Нажмите на пути в сеансе - что вы просматривали независимо от того, было ли это в вашей корзине
- Количество просмотров товара до окончательной покупки
- Если вы имеете дело с обычным магазином, у них тоже может быть история ваших физических покупок (например, игрушки у нас или что-то в сети, а также физический магазин)
- и тд и тп
К счастью, люди ведут себя одинаково в совокупности, поэтому, чем больше они знают о покупательском населении в целом, тем лучше они знают, что будут продаваться, а что нет, и с каждой транзакцией и каждым рейтингом / списком пожеланий добавляют / просматривают, знают, как более индивидуально подгонять рекомендации. Имейте в виду, что это всего лишь небольшая выборка из всего набора влияний того, что заканчивается рекомендациями и т. Д.
Теперь у меня нет внутренних знаний о том, как Amazon ведет бизнес (никогда там не работал), и все, что я делаю, это говорю о классических подходах к проблеме онлайн-торговли - я был премьер-министром, который работал над интеллектуальным анализом данных и аналитикой для Microsoft. Продукт называется Commerce Server. Мы поставили на Commerce Server инструменты, которые позволили людям создавать сайты с похожими возможностями ... но чем больше объем продаж, тем лучше данные, тем лучше модель - и Amazon БОЛЬШОЙ. Я могу только представить, как весело играть с моделями с таким большим количеством данных на коммерческом сайте. Теперь многие из этих алгоритмов (например, предиктор, начатый на коммерческом сервере) перешли на прямую жизнь в Microsoft SQL .
Четыре больших пути, которые вы должны иметь:
- Amazon (или любой розничный продавец) просматривает сводные данные о тоннах транзакций и тоннах людей ... это позволяет им даже очень хорошо рекомендовать анонимных пользователей на своем сайте.
- Amazon (или любой изощренный розничный продавец) отслеживает поведение и покупки любого, кто вошел в систему, и использует это для дальнейшего уточнения на основе массовых совокупных данных.
- Часто есть средства перебора накопленных данных и получения «редакционного» контроля над предложениями для менеджеров по продуктам определенных линий (например, некоторых людей, которые владеют вертикальными «цифровыми камерами» или вертикальными «романами» или аналогичными), где они действительно являются экспертами
- Часто существуют рекламные предложения (например, Sony, Panasonic, Nikon, Canon, Sprint или Verizon выплачивают дополнительные деньги розничному продавцу или предоставляют более выгодную скидку при больших количествах или других вещах в этих строках), что приводит к тому, что определенные «предложения» возрастают до это чаще, чем другие - за этим всегда стоит разумная бизнес-логика и бизнес-причина, нацеленная на увеличение прибыли от каждой транзакции или сокращение оптовых затрат и т. д.
С точки зрения фактической реализации? Почти все крупные онлайн-системы сводятся к некоторому набору конвейеров (или реализации шаблонов фильтров, или рабочего процесса и т. Д., Вы называете это так, как хотите), которые позволяют оценивать контекст с помощью ряда модулей, которые применяют некоторую форму бизнес логика
Как правило, с каждой отдельной задачей на странице ассоциируется другой конвейер - у вас может быть тот, который рекомендует «пакеты / апселлы» (то есть купить его с товаром, на который вы смотрите), и тот, который делает «альтернативы» (то есть покупка это вместо того, на что вы смотрите) и другое, которое выбирает предметы, наиболее тесно связанные с вашим списком пожеланий (по категориям товаров или аналогичным).
Результаты этих конвейеров могут быть размещены в различных частях страницы (над полосой прокрутки, под прокруткой, слева, справа, разными шрифтами, изображениями разного размера и т. Д.) И протестированы, чтобы увидеть, какие Лучший. Поскольку вы используете удобные модули plug-and-play, которые определяют бизнес-логику для этих конвейеров, вы получаете моральный эквивалент блоков lego, которые позволяют легко выбирать бизнес-логику, которую вы хотите применить при создании другого конвейера. что позволяет быстрее инноваций, больше экспериментов, и, в конечном итоге, более высокую прибыль.
Это помогло вообще? Надеюсь, что это даст вам некоторое представление о том, как это работает в целом для любого сайта электронной коммерции - не только для Amazon. Amazon (от общения с друзьями, которые там работали) очень ориентирован на данные и постоянно измеряет эффективность пользовательского опыта, цен, продвижения, упаковки и т. Д. - они являются очень сложным розничным продавцом в Интернете и, вероятно, находятся на переднем крае множество алгоритмов, которые они используют для оптимизации прибыли - и это, скорее всего, частные секреты (вы знаете, как формула для секретных специй KFC) и охраняются как таковые.