Вопросы с тегом «data-mining»

Деятельность, которая ищет шаблоны в больших, сложных наборах данных. Обычно в нем делается акцент на алгоритмических методах, но может также использоваться любой набор связанных навыков, приложений или методологий с этой целью.

4
Как отладить анализ данных?
Я столкнулся со следующей проблемой, которая, по моему мнению, довольно типична. У меня есть большие данные, скажем, несколько миллионов строк. Я провел некоторый нетривиальный анализ, например, SQL-запрос, состоящий из нескольких подзапросов. Я получаю некоторый результат, утверждая, например, что свойство X увеличивается со временем. Теперь есть две возможные вещи, которые могут …

1
Кластеризация данных клиентов, хранящихся в ElasticSearch
У меня есть куча профилей клиентов, хранящихся в elasticsearchкластер. Эти профили теперь используются для создания целевых групп для наших подписок на электронную почту. Целевые группы в настоящее время формируются вручную с использованием возможностей поиска с использованием эластичного поиска (например, получить всех клиентов мужского пола в возрасте 23 лет с одним …

5
Как создать хороший список стоп-слов
Я ищу несколько советов о том, как составить список стоп-слов. Кто-то знает / кто-то может порекомендовать хороший метод для извлечения списков стоп-слов из самого набора данных для предварительной обработки и фильтрации? Данные: огромное количество вводимого человеком текста различной длины (поисковые термины и целые предложения (до 200 символов)) в течение нескольких …

2
Как смоделировать покупательское поведение пользователя на Amazon?
Для нашего окончательного курсового проекта в Data Science мы предложили следующее: Предоставляя набор данных Amazon Reviews , мы планируем разработать алгоритм (который примерно основан на персонализированном PageRank), который определяет стратегическую позицию для размещения рекламы на Amazon. Например, на Amazon есть миллионы продуктов. И набор данных дает вам представление о том, …

1
Кодирование обучающего сигнала
У меня есть большое количество выборок, которые представляют битовые потоки, закодированные в Манчестере, в виде аудиосигналов. Частота, на которой они кодируются, является основной составляющей частоты, когда она высокая, и на заднем плане присутствует постоянный уровень белого шума. Я вручную декодировал эти потоки, но мне было интересно, смогу ли я использовать …

1
Реляционный Data Mining без ILP
У меня есть огромный набор данных из реляционной базы данных, для которого мне нужно создать модель классификации. Обычно для этой ситуации я бы использовал индуктивное логическое программирование (ILP), но из-за особых обстоятельств я не могу этого сделать. Другой способ решения этой проблемы - просто объединить значения, когда у меня есть …

2
Распознавание человеческой деятельности с помощью набора данных смартфона
Я новичок в этом сообществе, и, надеюсь, мой вопрос вполне уместится здесь. В рамках моего курса по анализу данных для студентов я выбрал проект по распознаванию человеческой деятельности с использованием наборов данных смартфона. Что касается меня, то эта тема касается машинного обучения и опорных векторных машин. Я еще не очень …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.