программирование machine-learning

7

Существует ли практическое правило о том, как разделить набор данных на наборы обучения и проверки?

Существует ли практическое правило о том, как лучше разделить данные на обучающие и проверочные наборы? Рекомендуется ли разделение на 50/50? Или есть явные преимущества наличия большего количества обучающих данных относительно проверочных данных (или наоборот)? Или этот выбор в значительной степени зависит от приложения? Я в основном использовал 80% / 20% …

196 machine-learning

21

Разница между классификацией и кластеризацией в интеллектуальном анализе данных? [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто в прошлом году . Улучшить этот вопрос Может кто-нибудь объяснить, в чем разница между классификацией …

195 machine-learning classification cluster-analysis data-mining terminology

6

Сохранить классификатор на диск в Scikit-Learn

Как сохранить обученный наивный байесовский классификатор на диск и использовать его для прогнозирования данных? У меня есть следующий пример программы с сайта scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" % (iris.target …

192 python machine-learning scikit-learn classification

7

Можно ли указать собственную функцию расстояния с помощью кластеризации K-Means scikit-learn?

172 python machine-learning cluster-analysis k-means scikit-learn

14

Ближайшие соседи по многомерным данным?

Несколько дней назад я задал вопрос о том, как найти ближайших соседей для данного вектора. Мой вектор теперь 21 измерения, и прежде чем я продолжу дальше, потому что я не из области машинного обучения или математики, я начинаю задавать себе некоторые фундаментальные вопросы: Является ли евклидово расстояние хорошей метрикой для …

163 algorithm language-agnostic search machine-learning nearest-neighbor

11

Почему двоичные_кросентропии и категориальные_кросентропии дают разные результаты для одной и той же проблемы?

Я пытаюсь обучить Си-Эн-Эн классифицировать текст по темам. Когда я использую двоичную кросс-энтропию, я получаю точность ~ 80%, с категориальной кросс-энтропией я получаю точность ~ 50%. Я не понимаю, почему это так. Это проблема мультикласса, не означает ли это, что я должен использовать категорическую перекрестную энтропию и что результаты с …

160 machine-learning keras neural-network deep-learning conv-neural-network

21

Как извлечь правила принятия решений из дерева решений scikit-learn?

Могу ли я извлечь базовые правила принятия решений (или «пути принятия решений») из обученного дерева в дереве решений в виде текстового списка? Что-то вроде: if A>0.4 then if B<0.2 then if C>0.8 then class='X' Спасибо за вашу помощь.

157 python machine-learning scikit-learn decision-tree random-forest

6

Как понять локальное хеширование?

Я заметил, что LSH, кажется, хороший способ найти похожие элементы с большими свойствами. После прочтения статьи http://www.slaney.org/malcolm/yahoo/Slaney2008-LSHTutorial.pdf я все еще не понимаю эти формулы. Кто-нибудь знает блог или статью, которая объясняет, что легкий путь?

156 c machine-learning hashmap nearest-neighbor locality-sensitive-hash

9

Почему мы должны нормализовать ввод для искусственной нейронной сети?

Это принципиальный вопрос, касающийся теории нейронных сетей: Почему мы должны нормализовать вход для нейронной сети? Я понимаю, что иногда, когда, например, входные значения не числовые, необходимо выполнить определенное преобразование, но когда у нас есть числовой ввод? Почему числа должны быть в определенном интервале? Что будет, если данные не нормализуются?

151 tensorflow machine-learning neural-network normalization

4

TensorFlow, почему Python был выбран языком?

Недавно я начал изучать глубокое обучение и другие методы машинного обучения, и я начал искать фреймворки, которые упрощают процесс построения сети и ее обучения, затем я нашел TensorFlow, имея небольшой опыт в этой области, для меня скорость - это большой фактор для того, чтобы сделать большую систему машинного обучения еще …

148 python c++ machine-learning tensorflow

5

Как разбить данные на 3 набора (тренировка, проверка и тестирование)?

У меня есть датафрейм pandas, и я хочу разделить его на 3 отдельных набора. Я знаю , что с помощью train_test_split из sklearn.cross_validation, можно разделить данные в двух сетах (поезд и тест). Тем не менее, я не смог найти никакого решения о разделении данных на три набора. Желательно, чтобы у …

146 pandas numpy dataframe machine-learning scikit-learn

13

Почему необходимо использовать нелинейную функцию активации в нейронной сети обратного распространения? [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 3 месяца назад . Уточните этот вопрос Я читал кое-что о нейронных сетях и понимаю общий принцип однослойной нейронной сети. …

143 math machine-learning neural-network deep-learning

8

Когда мне следует использовать генетические алгоритмы, а не нейронные сети? [закрыто]

В его нынешнем виде этот вопрос не подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, потребует дебатов, аргументов, опросов или расширенного обсуждения. Если вы считаете, что этот вопрос можно улучшить и, возможно, снова открыть, обратитесь за …

140 artificial-intelligence machine-learning neural-network genetic-algorithm

7

Как обучить искусственную нейронную сеть игре в Diablo 2 с помощью визуального ввода?

В настоящее время я пытаюсь получить ИНС для игры в видеоигру, и я надеялся получить некоторую помощь от замечательного сообщества здесь. Я остановился на Diablo 2. Таким образом, игра ведется в реальном времени с изометрической точки зрения, когда игрок управляет одним аватаром, на котором сфокусирована камера. Чтобы сделать вещи конкретными, …

139 machine-learning computer-vision neural-network video-processing reinforcement-learning

20

Как я могу выполнить горячее кодирование в Python?

У меня проблема классификации машинного обучения с 80% категориальных переменных. Должен ли я использовать одно горячее кодирование, если я хочу использовать какой-либо классификатор для классификации? Могу ли я передать данные классификатору без кодировки? Я пытаюсь сделать следующее для выбора функции: Прочитал досье поезда: num_rows_to_read = 10000 train_small = pd.read_csv("../../dataset/train.csv", nrows=num_rows_to_read) …

132 python pandas machine-learning anaconda one-hot-encoding

Вопросы с тегом «machine-learning»