Вопросы с тегом «machine-learning»

Алгоритмы машинного обучения строят модель обучающих данных. Термин «машинное обучение» определен неопределенно; оно включает в себя то, что также называется статистическим обучением, обучением с подкреплением, обучением без присмотра и т. д. ВСЕГДА ДОБАВЛЯЙТЕ БОЛЬШЕ КОНКРЕТНОЙ ТАГ.

4
Разница ядер в SVM?
Может кто-нибудь подскажите пожалуйста разницу между ядрами в SVM: линейный многочлен Гауссовский (RBF) сигмоид Потому что, как мы знаем, ядро ​​используется для отображения нашего входного пространства в пространство пространственных объектов высокой размерности. И в этом пространстве признаков мы находим линейно отделимую границу .. Когда они используются (при каких условиях) и …

2
Оценка дисперсии в k-кратной перекрестной проверке
K-кратная перекрестная проверка может использоваться для оценки возможности обобщения данного классификатора. Могу ли я (или я должен) также вычислить объединенную дисперсию из всех проверочных прогонов, чтобы получить лучшую оценку ее дисперсии? Если нет, то почему? Я нашел документы, в которых действительно используется объединенное стандартное отклонение при выполнении перекрестной проверки . …

2
Нейронная сеть: для двоичной классификации использовать 1 или 2 выходных нейрона?
Предположим, я хочу сделать бинарную классификацию (что-то принадлежит классу A или классу B). Есть несколько возможностей сделать это в выходном слое нейронной сети: Используйте 1 выходной узел. Выход 0 (<0.5) считается классом A, а 1 (> = 0.5) считается классом B (в случае сигмовидной кишки) Используйте 2 выходных узла. Входные …

3
Как судить о том, что контролируемая модель машинного обучения подходит или нет?
Может кто-нибудь сказать мне, как судить, модель контролируемого машинного обучения переоснащение или нет? Если у меня нет внешнего набора данных проверки, я хочу знать, могу ли я использовать ROC с 10-кратной перекрестной проверкой, чтобы объяснить переобучение. Если у меня есть внешний набор данных проверки, что мне делать дальше?

5
Может ли глубокая нейронная сеть приблизить функцию умножения без нормализации?
Допустим, мы хотим сделать регрессию для простого f = x * yиспользования стандартной глубокой нейронной сети. Я помню, что есть исследования, которые говорят о том, что NN с одним скрытым слоем может апоксировать любую функцию, но я пытался и без нормализации NN не смог приблизиться даже к этому простому умножению. …

4
Как определить оптимальный порог для классификатора и сгенерировать ROC-кривую?
Допустим, у нас есть классификатор SVM, как мы генерируем кривую ROC? (Как теоретически) (потому что мы генерируем TPR и FPR с каждым порогом). И как определить оптимальный порог для этого классификатора SVM?

1
Что такое абляция? И есть ли систематический способ сделать это?
Что такое абляция? И есть ли систематический способ сделать это? Например, у меня есть NNn предикторов в линейной регрессии, которые я назову своей моделью. Как я проведу исследование абляции с этим? Какие метрики я должен использовать? Всесторонний источник или учебник был бы оценен.

1
Почему PCA чувствителен к выбросам?
В этой SE много постов, в которых обсуждаются надежные подходы к анализу главных компонентов (PCA), но я не могу найти ни одного хорошего объяснения того, почему PCA в первую очередь чувствителен к выбросам.

1
Какие классические обозначения в статистике, линейной алгебре и машинном обучении? И какие связи между этими обозначениями?
Когда мы читаем книгу, понимание обозначений играет очень важную роль в понимании содержания. К сожалению, разные сообщества имеют разные условные обозначения для формулировки модели и задачи оптимизации. Может ли кто-нибудь суммировать некоторые обозначения формулировки здесь и указать возможные причины? Я приведу здесь пример: в литературе по линейной алгебре классическая книга …

6
Как выбрать между ROC AUC и F1 баллом?
Я недавно закончил соревнование Kaggle, в котором по требованию соревнования использовался roc auc. До этого проекта я обычно использовал показатель f1 в качестве метрики для измерения производительности модели. В будущем мне будет интересно, как выбрать между этими двумя показателями? Когда использовать какие и каковы их плюсы и минусы? Кстати, я …

1
Один против всех и Один против одного в свм?
В чем разница между классификатором SVM «один против всех» и «один против одного»? Означает ли «один против всех» один классификатор, чтобы классифицировать все типы / категории нового изображения, и означает, что каждый тип / категория нового изображения классифицируется с помощью другого классификатора (каждая категория обрабатывается специальным классификатором)? Например, если новое …

3
Тематические модели и методы совместного использования слов
Популярные тематические модели, такие как LDA, обычно объединяют слова, которые обычно объединяются в одну и ту же тему (кластер). В чем основное различие между такими тематическими моделями и другими простыми подходами кластеризации на основе совпадений, такими как PMI? (PMI расшифровывается как Pointwise Mutual Information и используется для идентификации слов, которые …

1
Потеря обучения идет вниз и снова. Что происходит?
Моя потеря тренировки снижается, а затем снова растет. Это очень странно. Потеря перекрестной проверки отслеживает потерю обучения. Что происходит? У меня есть два сложенных LSTMS следующим образом (на Keras): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', optimizer='adadelta') Я тренирую это для 100 Эпох: …

4
Зачем кому-то использовать KNN для регрессии?
Из того, что я понимаю, мы можем построить только регрессионную функцию, которая находится в интервале данных обучения. Например (необходима только одна из панелей): Как бы я мог предсказать будущее, используя регрессор KNN? Опять же, это, кажется, только приближает функцию, которая находится в пределах интервала обучающих данных. Мой вопрос: каковы преимущества …

2
В сущности, какова реальная разница между cv и repeatcv?
Это похоже на методы повторной выборки вопроса Карета , хотя в действительности это никогда не отвечало на эту часть вопроса согласованным образом. Функция поезда Caret предлагает cvи repeatedcv. В чем разница, скажем, делать: MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) против MyTrainControl=trainControl( method = "repeatedcv", number=5, repeats=5 ) Я понимаю, …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.