Статистика и большие данные machine-learning

6

Каковы основные теоремы в машинном (глубоком) обучении?

Аль Рахими недавно выступил с весьма провокационным докладом в NIPS 2017, сравнивая современное машинное обучение с алхимией. Одним из его утверждений является то, что нам нужно вернуться к теоретическим разработкам, чтобы иметь простые теоремы, доказывающие основополагающие результаты. Когда он сказал это, я начал искать основные теоремы для ML, но не …

45 machine-learning deep-learning theory

2

Линейное ядро и нелинейное ядро для опорных векторов машины?

При использовании машины опорных векторов есть ли какие-либо рекомендации по выбору линейного ядра или нелинейного ядра, например, RBF? Я когда-то слышал, что нелинейное ядро имеет тенденцию не работать хорошо, когда количество функций велико. Есть ли какие-либо ссылки на этот вопрос?

45 machine-learning classification svm references kernel-trick

8

Все модели бесполезны? Возможна ли какая-то точная модель - или полезная?

Этот вопрос был в моей голове более месяца. Выпуск Amstat News за февраль 2015 года содержит статью профессора Беркли Марка ван дер Лаана, которая ругает людей за использование неточных моделей. Он утверждает, что при использовании моделей статистика становится искусством, а не наукой. По его словам, всегда можно использовать «точную модель», …

45 machine-learning maximum-likelihood modeling nonparametric parametric

4

Как ядра применяются к картам объектов для создания других карт функций?

Я пытаюсь понять сверточную часть сверточных нейронных сетей. Глядя на следующий рисунок: У меня нет проблем с пониманием первого слоя свертки, где у нас есть 4 разных ядра (размером ), которые мы сворачиваем с входным изображением для получения 4 карт характеристик.к × кК×Кk \times k Что я не понимаю, так …

44 machine-learning neural-networks deep-learning conv-neural-network

6

Почему мультиколлинеарность не проверяется в современной статистике / машинном обучении

В традиционной статистике при построении модели мы проверяем мультиколлинеарность, используя такие методы, как оценки коэффициента инфляции дисперсии (VIF), но в машинном обучении вместо этого мы используем регуляризацию для выбора признаков и, похоже, не проверяем, коррелированы ли функции вообще. Зачем мы это делаем?

44 regression machine-learning multicollinearity regularization vif

4

Разница между случайным лесом и чрезвычайно рандомизированными деревьями

Я понял, что Случайный Лес и Чрезвычайно Рандомизированные Деревья отличаются в том смысле, что расщепления деревьев в Случайном Лесу являются детерминированными, тогда как они случайны в случае Чрезвычайно Рандомизированных Деревьев (чтобы быть более точным, следующее разделение является лучшим разделением среди случайных равномерных расщеплений в выбранных переменных для текущего дерева). Но …

44 machine-learning correlation references random-forest

13

Может ли машинное обучение расшифровать хэши SHA256?

У меня есть хэш-код SHA256 из 64 символов. Я надеюсь обучить модель, которая может предсказать, будет ли открытый текст, используемый для генерации хеша, начинаться с 1 или нет. Независимо от того, является ли это «возможным», какой алгоритм будет наилучшим подходом? Мои первые мысли: Создайте большую выборку хэшей, начинающуюся с 1, …

43 machine-learning logistic

3

Понимание роли дисконтного фактора в обучении с подкреплением

Я учу себя изучению подкрепления и пытаюсь понять концепцию дисконтированного вознаграждения. Таким образом, награда необходима, чтобы сообщить системе, какие пары состояние-действие хороши, а какие плохи. Но то, что я не понимаю, - то, почему дисконтированное вознаграждение необходимо. Почему должно иметь значение, достигнуто ли хорошее состояние скорее раньше, чем позже? Я …

43 machine-learning reinforcement-learning

2

Что такое maxout в нейронной сети?

Кто-нибудь может объяснить, что делают блоки maxout в нейронной сети? Как они работают и чем они отличаются от обычных единиц? Я попытался прочитать статью «Maxout Network» за 2013 год, написанную Goodfellow et al. (из группы профессора Йошуа Бенжио), но я не совсем понимаю.

42 machine-learning neural-networks

5

Является ли машинное обучение менее полезным для понимания причинности, и, следовательно, менее интересным для социальных наук?

Мое понимание различий между машинным обучением / другими методами статистического прогнозирования и видом статистики, которую используют ученые-социологи (например, экономисты), заключается в том, что экономисты, похоже, очень заинтересованы в понимании влияния одной или нескольких переменных - как с точки зрения величина и выявление причинно-следственных связей. Для этого вы в конечном итоге …

42 machine-learning econometrics

6

Почему внизу?

Предположим, я хочу узнать классификатор, который предсказывает, является ли электронная почта спамом. И предположим, что только 1% писем являются спамом. Проще всего было бы изучить тривиальный классификатор, который говорит, что ни одно из писем не является спамом. Этот классификатор дал бы нам точность 99%, но он не выучил бы ничего …

42 machine-learning classification

2

Панды / Statsmodel / Scikit-Learn

Являются ли Pandas, Statsmodels и Scikit-learn разными реализациями машинного обучения / статистических операций, или они дополняют друг друга? Какой из них обладает наиболее полной функциональностью? Какой из них активно разрабатывается и / или поддерживается? Я должен осуществить логистическую регрессию. Любые предложения относительно того, что из этого я должен использовать?

41 machine-learning python scikit-learn statsmodels pandas

1

Как интерпретировать ошибки меры?

Я запускаю классификацию в Weka для определенного набора данных, и я заметил, что если я пытаюсь предсказать номинальное значение, выходные данные конкретно показывают правильно и неправильно предсказанные значения. Тем не менее, теперь я запускаю его для числового атрибута и вывод: Correlation coefficient 0.3305 Mean absolute error 11.6268 Root mean squared …

41 machine-learning error weka mse rms

6

Практическая оптимизация гиперпараметров: случайный поиск по сетке

В настоящее время я прохожу случайный поиск по гиперпараметрической оптимизации Bengio и Bergsta [1], где авторы утверждают, что случайный поиск более эффективен, чем поиск по сетке, для достижения примерно одинаковой производительности. Мой вопрос: согласны ли здесь люди с этим утверждением? В своей работе я использовал поиск по сетке в основном …

41 machine-learning hyperparameter optimization

1

Чем softmax_cross_entropy_with_logits отличается от softmax_cross_entropy_with_logits_v2?

В частности, я предполагаю, что мне интересно это утверждение: Будущие основные версии TensorFlow позволят градиентам перетекать в метки, введенные на backprop по умолчанию. Который показан, когда я использую tf.nn.softmax_cross_entropy_with_logits. В том же сообщении он призывает меня взглянуть tf.nn.softmax_cross_entropy_with_logits_v2. Я просмотрел документацию, но она только утверждает, что для tf.nn.softmax_cross_entropy_with_logits_v2: Обратное распространение …

41 machine-learning supervised-learning tensorflow backpropagation

Вопросы с тегом «machine-learning»