Если я вас правильно понимаю, вы хотите ошибиться в сторону переоценки. Если это так, вам нужна соответствующая асимметричная функция стоимости. Одним простым кандидатом является настройка квадрата потерь:
L :(x,α)→ x2( s g n x + α )2
где - это параметр, который вы можете использовать, чтобы компенсировать штраф недооценки и переоценки. Положительные значения приводят к переоценке, поэтому вы должны установить отрицательным. В питоне это выглядит так- 1 < α < 1ααdef loss(x, a): return x**2 * (numpy.sign(x) + a)**2
Далее давайте сгенерируем некоторые данные:
import numpy
x = numpy.arange(-10, 10, 0.1)
y = -0.1*x**2 + x + numpy.sin(x) + 0.1*numpy.random.randn(len(x))
Наконец, мы сделаем нашу регрессию в tensorflow
библиотеке машинного обучения от Google, которая поддерживает автоматическое дифференцирование (упрощая оптимизацию таких задач на основе градиента). Я буду использовать этот пример в качестве отправной точки.
import tensorflow as tf
X = tf.placeholder("float") # create symbolic variables
Y = tf.placeholder("float")
w = tf.Variable(0.0, name="coeff")
b = tf.Variable(0.0, name="offset")
y_model = tf.mul(X, w) + b
cost = tf.pow(y_model-Y, 2) # use sqr error for cost function
def acost(a): return tf.pow(y_model-Y, 2) * tf.pow(tf.sign(y_model-Y) + a, 2)
train_op = tf.train.AdamOptimizer().minimize(cost)
train_op2 = tf.train.AdamOptimizer().minimize(acost(-0.5))
sess = tf.Session()
init = tf.initialize_all_variables()
sess.run(init)
for i in range(100):
for (xi, yi) in zip(x, y):
# sess.run(train_op, feed_dict={X: xi, Y: yi})
sess.run(train_op2, feed_dict={X: xi, Y: yi})
print(sess.run(w), sess.run(b))
cost
является обычной квадратической ошибкой, в то время acost
как вышеупомянутая асимметричная функция потерь.
Если вы используете, cost
вы получаете
1.00764 -3.32445
Если вы используете, acost
вы получаете
1.02604 -1.07742
acost
явно старается не недооценивать. Я не проверял на конвергенцию, но вы поняли идею.