Наука о данных machine-learning

3

Я изучаю масштабирование данных, и в частности метод стандартизации. Я понял математику, стоящую за этим, но мне не понятно, почему важно дать функциям нулевое среднее и единичную дисперсию. Можете ли вы объяснить мне?

10 machine-learning feature-scaling normalization

4

Считается ли PCA алгоритмом машинного обучения?

Я понял, что анализ главных компонентов - это метод уменьшения размерности, то есть, учитывая 10 входных объектов, он даст меньшее количество независимых элементов, которые являются ортогональными и линейными преобразованиями исходных элементов. Является ли PCAсам по себе рассматривается как алгоритм обучения или это шаг предварительной обработки данных.

10 machine-learning pca

3

Можно ли использовать координаты GPS (широту и долготу) в качестве элементов в линейной модели?

У меня есть наборы данных, которые содержат, среди многих функций, GPS-координаты (широта и долгота). Я хотел бы использовать эти наборы данных для изучения таких проблем, как: (1) вычисление ETA для перехода между начальной и конечной точками; и (2) оценка количества преступлений по конкретной точке. Я хотел бы использовать модель линейной …

10 machine-learning feature-selection linear-regression feature-extraction geospatial

2

Keras Несколько «Softmax» в последнем слое возможно?

Можно ли реализовать несколько softmaxes в последнем слое в Keras? Таким образом, сумма узлов 1-4 = 1; 5-8 = 1; и т.п. Должен ли я пойти на другой дизайн сети?

10 machine-learning keras multiclass-classification

2

Как выполнить логистическую регрессию с большим количеством функций?

У меня есть набор данных с 330 выборками и 27 функциями для каждой выборки, с проблемой двоичного класса для логистической регрессии. Согласно «правилу если десять» мне нужно по крайней мере 10 событий для каждой функции, которая будет включена. Тем не менее, у меня есть несбалансированный набор данных, с 20% положительного …

10 machine-learning python predictive-modeling logistic-regression data

2

Что такое матрица функций в word2vec?

Я новичок в нейронных сетях, и в настоящее время я изучаю модель word2vec. Однако мне трудно понять, что такое матрица функций. Я могу понять, что первая матрица является горячим вектором кодирования для данного слова, но что означает вторая матрица? Более конкретно, что означает каждое из этих значений (то есть 17, …

10 machine-learning neural-network word2vec

1

Как определить сложность английского предложения?

Я работаю над приложением, чтобы помочь людям выучить английский как второй язык. Я подтвердил, что предложения помогают в изучении языка, предоставляя дополнительный контекст. Я сделал это, проведя небольшое исследование в классе из 60 учеников. Я добыл более ста тысяч предложений из Википедии для различных английских слов (включая 800 слов Барронса …

10 machine-learning classification nlp text-mining

3

Предсказать лучшее время звонка

У меня есть набор данных, включающий набор клиентов в разных городах Калифорнии, время вызова для каждого клиента и статус вызова (True, если клиент отвечает на вызов, и False, если клиент не отвечает). Я должен найти подходящее время звонка для будущих клиентов, так что вероятность ответа на звонок высока. Итак, какова …

10 machine-learning classification regression scikit-learn

1

КАК: Инициализация веса глубоких нейронных сетей

Учитывая сложную задачу обучения (например, высокую размерность, сложность данных), глубокие нейронные сети становятся сложными для обучения. Чтобы облегчить многие из проблем, можно: Нормализовать && данные качества отобранных вручную выберите другой алгоритм обучения (например, RMSprop вместо Gradient Descent) выберите функцию более крутого градиента стоимости (например, перекрестная энтропия вместо MSE) Используйте другую …

10 machine-learning neural-network deep-learning randomized-algorithms

1

Пользователь-продукт положительный (нажмите данные) доступны. Как генерировать негатив (данные без кликов)?

Рекомендуется, чтобы у нас были данные о пользовательских продуктах, которые помечены, например, как «клик». Чтобы узнать модель, мне нужны данные по кликам и без кликов. Простейший подход к генерации - это взять пары продуктов пользователя, которые не найдены в данных о кликах. Однако это может вводить в заблуждение. Пример: user1, …

10 machine-learning data-mining

2

Что делать, если данные тестирования имеют меньше возможностей, чем данные обучения?

Допустим, мы прогнозируем продажи магазина, и мои данные обучения имеют два набора функций: Один о продаже магазина с датами (поле «Магазин» не является уникальным) Один из типов магазинов (поле «Магазин» здесь уникально) Таким образом, матрица будет выглядеть примерно так: +-------+-----------+------------+---------+-----------+------+-------+--------------+ | Store | DayOfWeek | Date | Sales | Customers …

10 machine-learning regression feature-selection feature-construction missing-data

2

Как ученые придумали правильные параметры и топологию скрытой модели Маркова для использования?

Я понимаю, как скрытая марковская модель используется в геномных последовательностях, таких как поиск гена. Но я не понимаю, как придумать конкретную марковскую модель. Я имею в виду, сколько состояний должна иметь модель? Сколько возможных переходов? Должна ли модель иметь петлю? Как они узнали бы, что их модель оптимальна? Представляют ли …

10 machine-learning model-selection hyperparameter markov

1

Как рассчитать дельта-член сверточного слоя, учитывая дельта-члены и веса предыдущего сверточного слоя?

Я пытаюсь обучить искусственную нейронную сеть с двумя сверточными слоями (с1, с2) и двумя скрытыми слоями (с1, с2). Я использую стандартный подход обратного распространения. При обратном проходе я вычисляю член ошибки слоя (дельта) на основе ошибки предыдущего слоя, весов предыдущего слоя и градиента активации относительно функции активации текущего слоя. Более …

10 machine-learning data-mining neural-network deep-learning

2

Усиление локально-чувствительного хэша

Я пытаюсь создать хеш, чувствительный к косинусной местности, чтобы найти подходящие пары элементов без необходимости сравнивать каждую возможную пару. У меня это в основном работает, но большинство пар в моих данных, похоже, имеют косинусное сходство в диапазоне от -0,2 до +0,2, поэтому я пытаюсь нарезать кубики довольно точно и выбирать …

10 machine-learning

2

Сколько времени занимают классификаторы scikit, чтобы классифицировать?

Я планирую использовать классификатор линейных опорных векторов (SVM) Scikit для классификации текста в корпусе, состоящем из 1 миллиона помеченных документов. Я планирую сделать следующее: когда пользователь вводит какое-либо ключевое слово, классификатор сначала классифицирует его по категории, а затем в документах этой категории будет выполняться последующий запрос на получение информации. У …

10 machine-learning classification python scikit-learn

Вопросы с тегом «machine-learning»