Вопросы с тегом «machine-learning»

Вопросы реализации алгоритмов машинного обучения. Общие вопросы о машинном обучении должны быть отправлены в их конкретные сообщества.

7
Существует ли практическое правило о том, как разделить набор данных на наборы обучения и проверки?
Существует ли практическое правило о том, как лучше разделить данные на обучающие и проверочные наборы? Рекомендуется ли разделение на 50/50? Или есть явные преимущества наличия большего количества обучающих данных относительно проверочных данных (или наоборот)? Или этот выбор в значительной степени зависит от приложения? Я в основном использовал 80% / 20% …

21
Разница между классификацией и кластеризацией в интеллектуальном анализе данных? [закрыто]
Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто в прошлом году . Улучшить этот вопрос Может кто-нибудь объяснить, в чем разница между классификацией …

6
Сохранить классификатор на диск в Scikit-Learn
Как сохранить обученный наивный байесовский классификатор на диск и использовать его для прогнозирования данных? У меня есть следующий пример программы с сайта scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" % (iris.target …


14
Ближайшие соседи по многомерным данным?
Несколько дней назад я задал вопрос о том, как найти ближайших соседей для данного вектора. Мой вектор теперь 21 измерения, и прежде чем я продолжу дальше, потому что я не из области машинного обучения или математики, я начинаю задавать себе некоторые фундаментальные вопросы: Является ли евклидово расстояние хорошей метрикой для …

11
Почему двоичные_кросентропии и категориальные_кросентропии дают разные результаты для одной и той же проблемы?
Я пытаюсь обучить Си-Эн-Эн классифицировать текст по темам. Когда я использую двоичную кросс-энтропию, я получаю точность ~ 80%, с категориальной кросс-энтропией я получаю точность ~ 50%. Я не понимаю, почему это так. Это проблема мультикласса, не означает ли это, что я должен использовать категорическую перекрестную энтропию и что результаты с …

21
Как извлечь правила принятия решений из дерева решений scikit-learn?
Могу ли я извлечь базовые правила принятия решений (или «пути принятия решений») из обученного дерева в дереве решений в виде текстового списка? Что-то вроде: if A>0.4 then if B<0.2 then if C>0.8 then class='X' Спасибо за вашу помощь.

6
Как понять локальное хеширование?
Я заметил, что LSH, кажется, хороший способ найти похожие элементы с большими свойствами. После прочтения статьи http://www.slaney.org/malcolm/yahoo/Slaney2008-LSHTutorial.pdf я все еще не понимаю эти формулы. Кто-нибудь знает блог или статью, которая объясняет, что легкий путь?

9
Почему мы должны нормализовать ввод для искусственной нейронной сети?
Это принципиальный вопрос, касающийся теории нейронных сетей: Почему мы должны нормализовать вход для нейронной сети? Я понимаю, что иногда, когда, например, входные значения не числовые, необходимо выполнить определенное преобразование, но когда у нас есть числовой ввод? Почему числа должны быть в определенном интервале? Что будет, если данные не нормализуются?

4
TensorFlow, почему Python был выбран языком?
Недавно я начал изучать глубокое обучение и другие методы машинного обучения, и я начал искать фреймворки, которые упрощают процесс построения сети и ее обучения, затем я нашел TensorFlow, имея небольшой опыт в этой области, для меня скорость - это большой фактор для того, чтобы сделать большую систему машинного обучения еще …

5
Как разбить данные на 3 набора (тренировка, проверка и тестирование)?
У меня есть датафрейм pandas, и я хочу разделить его на 3 отдельных набора. Я знаю , что с помощью train_test_split из sklearn.cross_validation, можно разделить данные в двух сетах (поезд и тест). Тем не менее, я не смог найти никакого решения о разделении данных на три набора. Желательно, чтобы у …

13
Почему необходимо использовать нелинейную функцию активации в нейронной сети обратного распространения? [закрыто]
Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 3 месяца назад . Уточните этот вопрос Я читал кое-что о нейронных сетях и понимаю общий принцип однослойной нейронной сети. …

8
Когда мне следует использовать генетические алгоритмы, а не нейронные сети? [закрыто]
В его нынешнем виде этот вопрос не подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, потребует дебатов, аргументов, опросов или расширенного обсуждения. Если вы считаете, что этот вопрос можно улучшить и, возможно, снова открыть, обратитесь за …

7
Как обучить искусственную нейронную сеть игре в Diablo 2 с помощью визуального ввода?
В настоящее время я пытаюсь получить ИНС для игры в видеоигру, и я надеялся получить некоторую помощь от замечательного сообщества здесь. Я остановился на Diablo 2. Таким образом, игра ведется в реальном времени с изометрической точки зрения, когда игрок управляет одним аватаром, на котором сфокусирована камера. Чтобы сделать вещи конкретными, …

20
Как я могу выполнить горячее кодирование в Python?
У меня проблема классификации машинного обучения с 80% категориальных переменных. Должен ли я использовать одно горячее кодирование, если я хочу использовать какой-либо классификатор для классификации? Могу ли я передать данные классификатору без кодировки? Я пытаюсь сделать следующее для выбора функции: Прочитал досье поезда: num_rows_to_read = 10000 train_small = pd.read_csv("../../dataset/train.csv", nrows=num_rows_to_read) …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.