Вопросы с тегом «machine-learning»

Методы и принципы построения «компьютерных систем, которые автоматически улучшаются с опытом».

2
Отладка нейронных сетей
Я построил искусственную нейронную сеть в Python, используя функцию оптимизации scipy.optimize.minimize (Conjugate Gradient). Я реализовал проверку градиента, дважды проверил все и т.д., и я уверен, что он работает правильно. Я запускал его несколько раз, и он достигает «Оптимизация успешно завершена», однако, когда я увеличиваю количество скрытых слоев, стоимость гипотезы увеличивается …

2
какие методы машинного / глубокого обучения / nlp используются для классификации данных слов как имени, номера мобильного телефона, адреса, адреса электронной почты, штата, округа, города и т. д.
Я пытаюсь создать интеллектуальную модель, которая может сканировать набор слов или строк и классифицировать их как имена, мобильные номера, адреса, города, штаты, страны и другие объекты, используя машинное обучение или глубокое обучение. Я искал подходы, но, к сожалению, не нашел подходов. Я пытался с моделью слова мешок и вложения слова …

1
Несбалансированные данные, приводящие к неправильной классификации в мультиклассовом наборе данных
Я работаю над классификацией текста, где у меня 39 категорий / классов и 8,5 миллионов записей. (В дальнейшем данные и категории будут увеличиваться). Структура или формат моих данных выглядит следующим образом. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 …

2
Какой алгоритм применить для выбора правильной точки
На рисунке ниже показано 7 точек вокруг начала координат. Один из них был выбран человеком на основе правил и опыта и окрашен в красный цвет (тот, что в левом нижнем квадранте). Теперь у нас есть более 1000 таких наборов точек, и для каждого набора человек выбрал одну точку. Эти условия …

2
«Теорема глубокого Нётера»: построение в симметрийных ограничениях
Если у меня есть проблема обучения, которая должна иметь внутреннюю симметрию, есть ли способ подвергнуть мою проблему обучения ограничению симметрии для улучшения обучения? Например, если я делаю распознавание изображения, мне может потребоваться 2D симметрия вращения. Это означает, что повернутая версия изображения должна получить тот же результат, что и оригинал. Или, …

1
Как мне подойти к проблеме классификации, когда один из классов определяется как «ни один из других»?
Предположим, что меня интересуют три класса , c 2 , c 3 . Но мой набор данных на самом деле содержит еще несколько реальных классов ( c j ) n j = 4 .с1c1c_1с2c2c_2с3с3c_3( сJ)NJ = 4(сJ)Jзнак равно4N(c_j)_{j=4}^n Очевидный ответ , чтобы определить новый класс гр 4 , который относится …

3
Почему бы не обучить окончательную модель полным данным после выполнения тестовых данных на основе настройки гиперпараметра и данных проверки на основе выбора модели?
Под всеми данными я имею в виду поезд + тест + проверка После того, как я исправил свой гиперпараметр, используя данные проверки, и выбрал модель, используя данные испытаний, не лучше ли будет обучать модель на всех данных, чтобы параметры лучше обучались, а не обучали модель только на данные поезда

1
количество параметров для сверточных слоев
В этой высоко цитируемой статье авторы приводят следующую дискуссию о количестве весовых параметров. Мне не очень понятно, почему у него параметров. Я думаю, что это должно быть 49 C, поскольку каждый из входных каналов C использует один и тот же фильтр, который имеет 49 параметров.49 С249C249C^249 С49C49CСCC494949

3
Зачем использовать сверточные NN для задачи визуального осмотра по сравнению с классическим сопоставлением шаблонов CV?
У меня возникла интересная дискуссия, основанная на проекте, над которым мы работали: зачем использовать систему визуального осмотра CNN поверх алгоритма сопоставления шаблонов? Справочная информация: я продемонстрировал демонстрацию простой системы видеонаблюдения CNN (веб-камера + ноутбук), которая обнаружила, был ли объект определенного типа «сломан» / неисправен или нет - в данном случае …

4
Интерпретация дерева решений в контексте важности функций
Я пытаюсь понять, как полностью понять процесс принятия решений модели классификации дерева решений, построенной с использованием sklearn. Два основных аспекта, на которые я смотрю, - это графическое представление дерева и список важных функций. Что я не понимаю, так это то, как важность функции определяется в контексте дерева. Например, вот мой …

2
Почему скорость обучения приводит к стремительному росту веса моей нейронной сети?
Я использую tenorflow для написания простых нейронных сетей для небольшого количества исследований, и у меня было много проблем с весами 'nan' во время обучения. Я пробовал много разных решений, таких как смена оптимизатора, изменение потерь, размера данных и т. Д., Но безрезультатно. Наконец, я заметил, что изменение в скорости обучения …

2
Особенности словосочетаний в word2vec
Я пытаюсь сделать анализ настроения. Чтобы преобразовать слова в слова, я использую модель word2vec. Предположим, у меня есть все предложения в списке под названием «предложения», и я передаю эти предложения в word2vec следующим образом: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Поскольку я новичок в словесных векторах, у …

1
Как подойти к конкурсу numer.ai с анонимными масштабированными числовыми предикторами?
Numer.ai существует уже какое-то время, и, похоже, в сети только несколько сообщений или других обсуждений. Время от времени система менялась, и сегодня ее установка такова: обучающие (N = 96K) и тестовые (N = 33K) данные с 21 признаком с непрерывными значениями в [0,1] и двоичной целью. Данные чистые (без пропущенных …

3
Какой механизм рекомендаций для ситуации, когда пользователи могут видеть только часть всех элементов?
Я хочу добавить функцию рекомендации в систему управления документами . Это сервер, на котором хранится большинство документов компании. Сотрудники просматривают веб-интерфейс и нажимают, чтобы загрузить (или прочитать в Интернете) нужные документы. Каждый сотрудник имеет доступ только к подмножеству всех документов: Моя цель : рекомендовать сотруднику документы, недавно открытые их товарищами …

3
Какие, если таковые имеются, алгоритмы машинного обучения считаются хорошим компромиссом между объяснимостью и предсказанием?
Тексты машинного обучения, описывающие алгоритмы, такие как машины повышения градиента или нейронные сети, часто комментируют, что эти модели хороши в прогнозировании, но это происходит за счет потери объяснимости или интерпретируемости. И наоборот, одиночные деревья решений и классические регрессионные модели помечены как хорошие для объяснения, но дают (относительно) низкую точность прогноза …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.