Я задал этот вопрос на сайте обмена стеками matemathics, и его рекомендовали задать здесь.
Я работаю над хобби-проектом и мне нужна помощь в решении следующей проблемы.
Немного контекста
Допустим, есть коллекция предметов с описанием возможностей и ценой. Представьте себе список автомобилей и цены. У всех автомобилей есть список характеристик, например, размер двигателя, цвет, мощность в лошадиных силах, модель, год и т. Д. Для каждой марки, что-то вроде этого:
Ford:
V8, green, manual, 200hp, 2007, $200
V6, red, automatic, 140hp, 2010, $300
V6, blue, manual, 140hp, 2005, $100
...
Более того, список автомобилей с ценами публикуется с некоторым интервалом времени, что означает, что у нас есть доступ к историческим данным о ценах. Может не всегда включать в себя одни и те же автомобили.
проблема
Я хотел бы понять, как смоделировать цены на любой автомобиль на основе этой базовой информации, а главное - автомобилей, которых нет в первоначальном списке.
Ford, v6, red, automatic, 130hp, 2009
Для вышеупомянутого автомобиля, он почти такой же, как в списке, только немного отличается в лошадиных силах и году. Чтобы оценить это, что нужно?
Я ищу что-то практичное и простое, но я также хотел бы услышать о более сложных подходах к моделированию чего-то подобного.
Что я пробовал
Вот что я экспериментировал до сих пор:
1) Использование исторических данных для поиска автомобиля X. Если не найдено, цены нет. Это, конечно, очень ограничено, и его можно использовать только в сочетании с некоторым затуханием времени, чтобы изменить цены на известные автомобили с течением времени.
2) использование весовой схемы автомобиля вместе с ценовой моделью автомобиля. В основном, что есть базовая цена и характеристики просто изменить это с некоторым фактором. На основании этого определяется цена любого автомобиля.
Первого оказалось недостаточно, а второе оказалось не всегда правильным, и у меня, возможно, не было лучшего подхода к использованию весов. Это также кажется немного тяжелым для поддержания весов, поэтому я подумал, что, может быть, есть какой-то способ использовать исторические данные в качестве статистики для получения весов или для чего-то еще. Я просто не знаю с чего начать.
Другие важные аспекты
- интегрировать в какой-то программный проект, который у меня есть. Либо с помощью существующих библиотек, либо самостоятельно пишу алгоритм.
- быстрый пересчет при поступлении новых исторических данных.
Любые предложения, как можно решить эту проблему? Все идеи приветствуются.
Большое спасибо заранее и с нетерпением ждем ваших предложений!