Как объединить два слоя в керасе?


96

У меня есть пример нейронной сети с двумя слоями. Первый уровень принимает два аргумента и имеет один выход. Второй должен принимать один аргумент как результат первого уровня и один дополнительный аргумент. Должно получиться так:

x1  x2  x3
 \  /   /
  y1   /
   \  /
    y2

Итак, я создал модель с двумя слоями и попытался их объединить, но он возвращает ошибку: The first layer in a Sequential model must get an "input_shape" or "batch_input_shape" argument.на линии result.add(merged).

Модель:

first = Sequential()
first.add(Dense(1, input_shape=(2,), activation='sigmoid'))

second = Sequential()
second.add(Dense(1, input_shape=(1,), activation='sigmoid'))

result = Sequential()
merged = Concatenate([first, second])
ada_grad = Adagrad(lr=0.1, epsilon=1e-08, decay=0.0)
result.add(merged)
result.compile(optimizer=ada_grad, loss=_loss_tensor, metrics=['accuracy'])

Ответы:


123

Вы получаете сообщение об ошибке, потому что он resultопределен как Sequential()контейнер для модели, и вы не определили для него ввод.

Учитывая то, что вы пытаетесь построить, установите resultтретий вход x3.

first = Sequential()
first.add(Dense(1, input_shape=(2,), activation='sigmoid'))

second = Sequential()
second.add(Dense(1, input_shape=(1,), activation='sigmoid'))

third = Sequential()
# of course you must provide the input to result which will be your x3
third.add(Dense(1, input_shape=(1,), activation='sigmoid'))

# lets say you add a few more layers to first and second.
# concatenate them
merged = Concatenate([first, second])

# then concatenate the two outputs

result = Concatenate([merged,  third])

ada_grad = Adagrad(lr=0.1, epsilon=1e-08, decay=0.0)

result.compile(optimizer=ada_grad, loss='binary_crossentropy',
               metrics=['accuracy'])

Однако я предпочитаю использовать функциональный api для создания модели с таким типом входной структуры .

Вот реализация ваших требований для начала:

from keras.models import Model
from keras.layers import Concatenate, Dense, LSTM, Input, concatenate
from keras.optimizers import Adagrad

first_input = Input(shape=(2, ))
first_dense = Dense(1, )(first_input)

second_input = Input(shape=(2, ))
second_dense = Dense(1, )(second_input)

merge_one = concatenate([first_dense, second_dense])

third_input = Input(shape=(1, ))
merge_two = concatenate([merge_one, third_input])

model = Model(inputs=[first_input, second_input, third_input], outputs=merge_two)
ada_grad = Adagrad(lr=0.1, epsilon=1e-08, decay=0.0)
model.compile(optimizer=ada_grad, loss='binary_crossentropy',
               metrics=['accuracy'])

Чтобы ответить на вопрос в комментариях:

  1. Как связаны результат и слияние? Предполагая, что вы имеете в виду, как они связаны.

Конкатенация работает так:

  a        b         c
a b c   g h i    a b c g h i
d e f   j k l    d e f j k l

т.е. строки просто соединяются.

  1. Теперь x1вводится для первого, x2вводится для второго и x3вводится для третьего.

Как слои resultи merged(или merged2) связаны друг с другом в первой части вашего ответа?
rdo

и второй вопрос. Как я понимаю , x1и x2является входным сигналом для first_input, x3для third_input. О чем second_input?
rdo

1
second_inputпроходит через Denseслой и конкатенируется, с first_inputкоторым также был пропущен через Denseслой. third_inputпроходит через плотный слой и объединяется с результатом предыдущей конкатенации ( merged)
parsethis

2
@putonspectacles Второй способ использования функционального API работает, однако первый способ использования Sequential-модели не работает для меня в Keras 2.0.2. Я примерно проверил реализацию, и вызов «Concatenate ([...])» мало что дает, и, более того, вы не можете добавить его в последовательную модель. На самом деле я думаю, что до обновления Keras все еще нужно использовать метод «Merge ([...], 'concat')». Что вы думаете?
LFish,

2
В чем разница между Concatenate()и concatenate()слоями в Keras?
Leevo 04

9

Добавление к принятому выше ответу, чтобы он помог тем, кто использует tensorflow 2.0


import tensorflow as tf

# some data
c1 = tf.constant([[1, 1, 1], [2, 2, 2]], dtype=tf.float32)
c2 = tf.constant([[2, 2, 2], [3, 3, 3]], dtype=tf.float32)
c3 = tf.constant([[3, 3, 3], [4, 4, 4]], dtype=tf.float32)

# bake layers x1, x2, x3
x1 = tf.keras.layers.Dense(10)(c1)
x2 = tf.keras.layers.Dense(10)(c2)
x3 = tf.keras.layers.Dense(10)(c3)

# merged layer y1
y1 = tf.keras.layers.Concatenate(axis=1)([x1, x2])

# merged layer y2
y2 = tf.keras.layers.Concatenate(axis=1)([y1, x3])

# print info
print("-"*30)
print("x1", x1.shape, "x2", x2.shape, "x3", x3.shape)
print("y1", y1.shape)
print("y2", y2.shape)
print("-"*30)

Результат:

------------------------------
x1 (2, 10) x2 (2, 10) x3 (2, 10)
y1 (2, 20)
y2 (2, 30)
------------------------------

7

Вы можете поэкспериментировать model.summary()(обратите внимание на размер слоя concatenate_XX (Concatenate))

# merge samples, two input must be same shape
inp1 = Input(shape=(10,32))
inp2 = Input(shape=(10,32))
cc1 = concatenate([inp1, inp2],axis=0) # Merge data must same row column
output = Dense(30, activation='relu')(cc1)
model = Model(inputs=[inp1, inp2], outputs=output)
model.summary()

# merge row must same column size
inp1 = Input(shape=(20,10))
inp2 = Input(shape=(32,10))
cc1 = concatenate([inp1, inp2],axis=1)
output = Dense(30, activation='relu')(cc1)
model = Model(inputs=[inp1, inp2], outputs=output)
model.summary()

# merge column must same row size
inp1 = Input(shape=(10,20))
inp2 = Input(shape=(10,32))
cc1 = concatenate([inp1, inp2],axis=1)
output = Dense(30, activation='relu')(cc1)
model = Model(inputs=[inp1, inp2], outputs=output)
model.summary()

Подробную информацию вы можете просмотреть здесь: https://nbviewer.jupyter.org/github/anhhh11/DeepLearning/blob/master/Concanate_two_layer_keras.ipynb


3
В чем разница между Concatenate()и concatenate()слоями в Keras?
Leevo 04

1
Вы выяснили разницу, один - это класс Keras, а другой - метод
тензорного
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.