Вопросы с тегом «machine-learning»

Методы и принципы построения «компьютерных систем, которые автоматически улучшаются с опытом».

3
Нулевое среднее и единичная дисперсия
Я изучаю масштабирование данных, и в частности метод стандартизации. Я понял математику, стоящую за этим, но мне не понятно, почему важно дать функциям нулевое среднее и единичную дисперсию. Можете ли вы объяснить мне?

4
Считается ли PCA алгоритмом машинного обучения?
Я понял, что анализ главных компонентов - это метод уменьшения размерности, то есть, учитывая 10 входных объектов, он даст меньшее количество независимых элементов, которые являются ортогональными и линейными преобразованиями исходных элементов. Является ли PCAсам по себе рассматривается как алгоритм обучения или это шаг предварительной обработки данных.

3
Можно ли использовать координаты GPS (широту и долготу) в качестве элементов в линейной модели?
У меня есть наборы данных, которые содержат, среди многих функций, GPS-координаты (широта и долгота). Я хотел бы использовать эти наборы данных для изучения таких проблем, как: (1) вычисление ETA для перехода между начальной и конечной точками; и (2) оценка количества преступлений по конкретной точке. Я хотел бы использовать модель линейной …


2
Как выполнить логистическую регрессию с большим количеством функций?
У меня есть набор данных с 330 выборками и 27 функциями для каждой выборки, с проблемой двоичного класса для логистической регрессии. Согласно «правилу если десять» мне нужно по крайней мере 10 событий для каждой функции, которая будет включена. Тем не менее, у меня есть несбалансированный набор данных, с 20% положительного …

2
Что такое матрица функций в word2vec?
Я новичок в нейронных сетях, и в настоящее время я изучаю модель word2vec. Однако мне трудно понять, что такое матрица функций. Я могу понять, что первая матрица является горячим вектором кодирования для данного слова, но что означает вторая матрица? Более конкретно, что означает каждое из этих значений (то есть 17, …

1
Как определить сложность английского предложения?
Я работаю над приложением, чтобы помочь людям выучить английский как второй язык. Я подтвердил, что предложения помогают в изучении языка, предоставляя дополнительный контекст. Я сделал это, проведя небольшое исследование в классе из 60 учеников. Я добыл более ста тысяч предложений из Википедии для различных английских слов (включая 800 слов Барронса …

3
Предсказать лучшее время звонка
У меня есть набор данных, включающий набор клиентов в разных городах Калифорнии, время вызова для каждого клиента и статус вызова (True, если клиент отвечает на вызов, и False, если клиент не отвечает). Я должен найти подходящее время звонка для будущих клиентов, так что вероятность ответа на звонок высока. Итак, какова …

1
КАК: Инициализация веса глубоких нейронных сетей
Учитывая сложную задачу обучения (например, высокую размерность, сложность данных), глубокие нейронные сети становятся сложными для обучения. Чтобы облегчить многие из проблем, можно: Нормализовать && данные качества отобранных вручную выберите другой алгоритм обучения (например, RMSprop вместо Gradient Descent) выберите функцию более крутого градиента стоимости (например, перекрестная энтропия вместо MSE) Используйте другую …

1
Пользователь-продукт положительный (нажмите данные) доступны. Как генерировать негатив (данные без кликов)?
Рекомендуется, чтобы у нас были данные о пользовательских продуктах, которые помечены, например, как «клик». Чтобы узнать модель, мне нужны данные по кликам и без кликов. Простейший подход к генерации - это взять пары продуктов пользователя, которые не найдены в данных о кликах. Однако это может вводить в заблуждение. Пример: user1, …

2
Что делать, если данные тестирования имеют меньше возможностей, чем данные обучения?
Допустим, мы прогнозируем продажи магазина, и мои данные обучения имеют два набора функций: Один о продаже магазина с датами (поле «Магазин» не является уникальным) Один из типов магазинов (поле «Магазин» здесь уникально) Таким образом, матрица будет выглядеть примерно так: +-------+-----------+------------+---------+-----------+------+-------+--------------+ | Store | DayOfWeek | Date | Sales | Customers …

2
Как ученые придумали правильные параметры и топологию скрытой модели Маркова для использования?
Я понимаю, как скрытая марковская модель используется в геномных последовательностях, таких как поиск гена. Но я не понимаю, как придумать конкретную марковскую модель. Я имею в виду, сколько состояний должна иметь модель? Сколько возможных переходов? Должна ли модель иметь петлю? Как они узнали бы, что их модель оптимальна? Представляют ли …

1
Как рассчитать дельта-член сверточного слоя, учитывая дельта-члены и веса предыдущего сверточного слоя?
Я пытаюсь обучить искусственную нейронную сеть с двумя сверточными слоями (с1, с2) и двумя скрытыми слоями (с1, с2). Я использую стандартный подход обратного распространения. При обратном проходе я вычисляю член ошибки слоя (дельта) на основе ошибки предыдущего слоя, весов предыдущего слоя и градиента активации относительно функции активации текущего слоя. Более …

2
Усиление локально-чувствительного хэша
Я пытаюсь создать хеш, чувствительный к косинусной местности, чтобы найти подходящие пары элементов без необходимости сравнивать каждую возможную пару. У меня это в основном работает, но большинство пар в моих данных, похоже, имеют косинусное сходство в диапазоне от -0,2 до +0,2, поэтому я пытаюсь нарезать кубики довольно точно и выбирать …

2
Сколько времени занимают классификаторы scikit, чтобы классифицировать?
Я планирую использовать классификатор линейных опорных векторов (SVM) Scikit для классификации текста в корпусе, состоящем из 1 миллиона помеченных документов. Я планирую сделать следующее: когда пользователь вводит какое-либо ключевое слово, классификатор сначала классифицирует его по категории, а затем в документах этой категории будет выполняться последующий запрос на получение информации. У …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.