Гиперпараметр - это просто параметр, который полностью или частично влияет на другие параметры. Они напрямую не решают проблему оптимизации, с которой вы сталкиваетесь, а скорее оптимизируют параметры, которые могут решить проблему (следовательно, гипер , потому что они не являются частью проблемы оптимизации, а скорее являются «аддонами»). Для того, что я видел, но у меня нет ссылки, это отношение является однонаправленным (гиперпараметр не может зависеть от параметров, на которые он влияет, а следовательно, и гипер ). Они обычно вводятся в схемы регуляризации или мета-оптимизации.
Например, ваш параметр может свободно влиять на и для корректировки стоимости регуляризации (но и не влияют на ). Таким образом, является гиперпараметром для и . Если бы у вас был дополнительный параметр влияющий на , это был бы гиперпараметр для и гипергиперпараметр для и (но я никогда не видел эту номенклатуру, но не чувствовал бы, что это будет неправильно если бы я это видел).λμσμσλλμστλλμσ
Я нашел концепцию гиперпараметра очень полезной для перекрестной проверки, потому что она напоминает вам об иерархии параметров, а также напоминает, что если вы все еще изменяете (гипер-) параметры, вы все равно выполняете перекрестную проверку и не обобщаете, поэтому вы должны будьте осторожны с вашими выводами (чтобы избежать кругового мышления).