Вопросы с тегом «feature-extraction»

Переменные (используемые для прогнозирования или объяснения), используемые в регрессионных или регрессионных моделях (например, кластеризация, дискриминация). Используйте этот тег, чтобы задать вопросы о построении таких переменных или выборе лучших из них.

11
Что такое уменьшение размерности? В чем разница между выбором объектов и извлечением?
Из википедии, Уменьшение размерности или уменьшение размерности - это процесс уменьшения количества рассматриваемых случайных величин, который можно разделить на выбор и извлечение признаков. В чем разница между выбором и извлечением объектов? Что является примером уменьшения размерности в задаче обработки естественного языка?

6
Есть ли инструменты для разработки функций?
В частности, я ищу инструменты с определенной функциональностью, которая специфична для разработки функций. Я хотел бы иметь возможность легко сглаживать, визуализировать, заполнять пробелы и т. Д. Что-то похожее на MS Excel, но в качестве базового языка вместо RB используется R.

6
Функции кодирования, такие как месяц и час, как категориальные или числовые?
Лучше ли кодировать функции, такие как месяц и час, как фактор или число в модели машинного обучения? С одной стороны, я считаю, что числовое кодирование может быть разумным, поскольку время - это прогрессирующий процесс (за пятым месяцем следует шестой), но с другой стороны, я думаю, что категориальное кодирование может быть …

3
Преобразование объектов на входных данных
Я читал о решении этой проблемы OTTO Kaggle, и первое решение, кажется, использует несколько преобразований для входных данных X, например, Log (X + 1), sqrt (X + 3/8) и т. Д. Есть ли общее руководство о том, когда применять какие виды преобразований к различным классификаторам? Я понимаю понятия нормализации среднего …

3
Каков хороший способ преобразовать циклические порядковые атрибуты?
У меня есть поле «час» в качестве моего атрибута, но оно принимает циклические значения. Как я мог преобразовать функцию, чтобы сохранить информацию, как '23' и '0' час близки. Один способ, которым я мог бы подумать, - это сделать преобразование: min(h, 23-h) Input: [0 1 2 3 4 5 6 7 …

3
Как выполнить проектирование функций на неизвестных функциях?
Я участвую в соревнованиях по борьбе. Набор данных имеет около 100 объектов, и все они неизвестны (с точки зрения того, что на самом деле они представляют). В основном это просто цифры. Люди выполняют много функций по разработке этих функций. Мне интересно, как именно можно выполнить разработку функций для функций, которые …

3
Функция извлечения изображений в Python
В моем классе я должен создать приложение, используя два классификатора, чтобы решить, является ли объект на изображении примером phylum porifera (seasponge) или каким-либо другим объектом. Тем не менее, я полностью растерялся, когда дело доходит до методов извлечения функций в Python. Мой советник убедил меня использовать изображения, которые не были рассмотрены …

2
Как выбрать функции для нейронной сети?
Я знаю, что нет четкого ответа на этот вопрос, но давайте предположим, что у меня огромная нейронная сеть с большим количеством данных, и я хочу добавить новую функцию ввода. «Лучший» способ - проверить сеть с помощью новой функции и увидеть результаты, но есть ли способ проверить, полезна ли эта функция …

5
сделать морскую карту тепла больше
Я создаю corr()DF из оригинального DF. corr()ДФ вышел 70 X 70 и невозможно представить себе Heatmap ... sns.heatmap(df). Если я попытаюсь отобразить corr = df.corr(), таблица не умещается на экране, и я вижу все корреляции. Это способ печати всего, dfнезависимо от его размера, или контроля размера тепловой карты?
16 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

5
Выбор функций против извлечения функций. Что использовать, когда?
Извлечение функций и выбор функций существенно уменьшают размерность данных, но извлечение функций также делает данные более разделимыми, если я прав. Какой метод предпочтительнее другого и когда? Я подумал, поскольку выбор функции не изменяет исходные данные и их свойства, я предполагаю, что вы будете использовать выбор функции, когда важно, чтобы функции, …

3
Почему мы преобразуем перекос данных в нормальное распределение
Я проходил решение конкурса цен на жилье на Kaggle ( ядро Human Analog по ценам на жилье : методы предварительной регрессии ) и наткнулся на эту часть: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features more normal. from scipy.stats import skew …

2
Какие особенности обычно используются из деревьев разбора в процессе классификации в НЛП?
Я изучаю различные типы структур дерева разбора. Двумя широко известными структурами дерева разбора являются: а) дерево разбора на основе постоянных и б) основанные на зависимости структуры дерева разбора. Я могу использовать генерацию обоих типов структур дерева разбора с помощью пакета Stanford NLP. Однако я не уверен, как использовать эти древовидные …

1
В чем разница между одной горячей кодировкой и одной внешней кодировкой?
Я читаю презентацию, и она рекомендует не использовать кодировку "оставь один", но с одной горячей кодировкой все в порядке. Я думал, что они оба были одинаковыми. Кто-нибудь может описать, в чем различия между ними?

3
Необучаемая функция обучения для NER
Я реализовал систему NER с использованием алгоритма CRF с моими функциями ручной работы, которые дали довольно хорошие результаты. Дело в том, что я использовал множество различных функций, включая POS-теги и леммы. Теперь я хочу сделать один и тот же NER для другого языка. Проблема в том, что я не могу …

3
Можно ли использовать координаты GPS (широту и долготу) в качестве элементов в линейной модели?
У меня есть наборы данных, которые содержат, среди многих функций, GPS-координаты (широта и долгота). Я хотел бы использовать эти наборы данных для изучения таких проблем, как: (1) вычисление ETA для перехода между начальной и конечной точками; и (2) оценка количества преступлений по конкретной точке. Я хотел бы использовать модель линейной …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.