Вопросы с тегом «optimization»

Используйте этот тег для любого использования оптимизации в статистике.

1
Математическое / Алгоритмическое определение для переоснащения
Есть ли математическое или алгоритмическое определение переоснащения? Часто предоставляемые определения представляют собой классический двухмерный график точек с линией, проходящей через каждую точку, и кривая потерь при проверке внезапно растет. Но есть ли математически строгое определение?

3
Методы оптимизации соответствуют методам выборки?
Из любого общего алгоритма выборки можно получить алгоритм оптимизации. Действительно, чтобы максимизировать произвольную функцию , достаточно извлечь образцы из . При достаточно малых значениях эти выборки окажутся вблизи глобального максимума (или на практике локального максимума) функции .е: x → f( х )е:Икс→е(Икс)f: \textbf{x} \rightarrow f(\textbf{x})грамм∼ ее/ Tграмм~ее/Tg \sim e^{f/T}TTTееf Под …

3
Есть ли способ максимизировать / минимизировать пользовательскую функцию в R?
Я пытаюсь свести к минимуму пользовательские функции. Он должен принимать пять параметров и набор данных и выполнять все виды вычислений, выдавая в качестве выходных данных одно число. Я хочу найти комбинацию из пяти входных параметров, которая дает наименьший выход моей функции.
18 r  optimization 

2
Используются ли методы линейного поиска в глубоком обучении? Почему нет?
Многие учебники онлайн рассказывают о градиентном спуске, и почти во всех из них используется фиксированный размер шага (скорость обучения ). Почему не используется поиск строк (например, поиск по линии с возвратом или точный поиск по строке)?αα\alpha

3
Как размер партии влияет на конвергенцию SGD и почему?
Я видел аналогичный вывод из многих дискуссий, что с увеличением размера мини-пакета конвергенция SGD становится все труднее / хуже, например, в этой статье и в этом ответе . Также я слышал о людях, использующих такие уловки, как небольшая скорость обучения или размеры партий на ранней стадии, для решения этой проблемы …

2
Следует ли рисовать обучающие образцы, выбранные случайным образом для мини-пакетных нейронных сетей, без замены?
Мы определяем эпоху как пройденную через все доступные обучающие выборки, а размер мини-пакета как число выборок, по которым мы усредняем, чтобы найти обновления весов / смещений, необходимые для снижения градиента. Мой вопрос заключается в том, следует ли нам рисовать без замены из набора обучающих примеров, чтобы генерировать каждую мини-серию в …

2
Можно ли применить градиентный спуск к невыпуклым функциям?
Я только изучаю оптимизацию и испытываю трудности с пониманием разницы между выпуклой и невыпуклой оптимизацией. Насколько я понимаю, выпуклая функция - это та, где «отрезок прямой между любыми двумя точками на графике функции лежит выше или на графике». В этом случае можно использовать алгоритм градиентного спуска, поскольку существует единственный минимум, …


3
Какой алгоритм оптимизации используется в функции glm в R?
Можно выполнить логит-регрессию в R, используя такой код: > library(MASS) > data(menarche) > glm.out = glm(cbind(Menarche, Total-Menarche) ~ Age, + family=binomial(logit), data=menarche) > coefficients(glm.out) (Intercept) Age -21.226395 1.631968 Похоже, что алгоритм оптимизации сходится - есть информация о количестве шагов алгоритма Фишера: Call: glm(formula = cbind(Menarche, Total - Menarche) ~ Age, …

1
Jenks Natural Breaks в Python: как найти оптимальное количество перерывов?
Я нашел эту реализацию Python в Дженкс Natural Breaks алгоритма , и я мог бы сделать его запустить на моем компьютере Windows 7. Это довольно быстро, и он находит разрывы за короткое время, учитывая размер моих геоданных. Прежде чем использовать этот алгоритм кластеризации для моих данных, я использовал sklearn.clustering.KMeans (здесь) …

2
Что здесь происходит, когда я использую квадрат потерь в настройке логистической регрессии?
Я пытаюсь использовать квадратичные потери, чтобы выполнить двоичную классификацию для набора данных игрушек. Я использую mtcarsнабор данных, использую милю на галлон и вес, чтобы предсказать тип передачи. На приведенном ниже графике показаны два типа данных типа передачи в разных цветах и ​​границы решения, сформированные различными функциями потерь. Квадратный убыток равен …

2
Разница остаточных стандартных ошибок между optim и glm
Я пытаюсь воспроизвести optimрезультаты простой линейной регрессии, снабженной glmили даже nlsR-функциями. Оценки параметров одинаковы, но оценка остаточной дисперсии и стандартные ошибки других параметров не одинаковы, особенно при небольшом размере выборки. Я полагаю, что это из-за различий в способе вычисления остаточной стандартной ошибки между подходами максимального правдоподобия и наименьшего квадрата (деление …

1
Значение предупреждения о сходимости в glmer
Я использую glmerфункцию из lme4пакета в R, и я использую bobyqaоптимизатор (т.е. по умолчанию в моем случае). Я получаю предупреждение, и мне любопытно, что это значит. Warning message: In optwrap(optimizer, devfun, start, rho$lower, control = control, : convergence code 3 from bobyqa: bobyqa -- a trust region step failed to …

3
Делать большие умные ставки
Я пытался написать алгоритм для предложения ставок в 1X2 (взвешенных) играх. По сути, в каждой игре есть набор матчей (домашние и выездные команды): 1: дом побеждает X: привлечь 2: прочь побеждает Для каждого совпадения и символа ( 1, Xи 2) я назначу процент, который представляет шансы / вероятность того, что …

2
Почему мы суетимся из-за использования очков Фишера, когда ставим GLM?
Мне любопытно, почему мы относимся к подгонке GLMS, как к какой-то особой проблеме оптимизации. Они? Мне кажется, что это просто максимальная вероятность, и мы записываем вероятность, а затем ... мы максимизируем ее! Так почему же мы используем оценку Фишера вместо множества схем оптимизации, разработанных в прикладной математической литературе?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.