Подробности:
GPU : GTX 1080
Обучение : ~ 1,1 млн. Изображений, принадлежащих 10 классам
Проверка : ~ 150 тысяч изображений, относящихся к 10 классам
Время за эпоху : ~ 10 часов
Я установил CUDA, cuDNN и Tensorflow (также Tensorflow GPU).
Я не думаю, что моя модель настолько сложна, что занимает 10 часов за эпоху. Я даже проверил, была ли проблема в моем GPU, но это не так.
Время обучения связано с полностью соединенными слоями?
Моя модель:
model = Sequential()
model.add()
model.add(Conv2D(64, (3, 3), padding="same", strides=2))
model.add(Activation('relu'))
model.add(Dropout(0.25))
model.add(Conv2D(64, (3, 3), padding="same", strides=2))
model.add(Activation('relu'))
model.add(Dropout(0.25))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(3, 3), strides=2))
model.add(Flatten())
model.add(Dense(256))
model.add(Activation('relu'))
model.add(Dense(4096))
model.add(Activation('relu'))
model.add(Dense(10))
model.add(Activation('softmax'))
model.summary()
opt = keras.optimizers.rmsprop(lr=0.0001, decay=1e-6)
model.compile(loss='categorical_crossentropy',
optimizer=opt,
metrics=['accuracy']
)
Поскольку данных много, я использовал ImageDataGenerator.
gen = ImageDataGenerator(
horizontal_flip=True
)
train_gen = gen.flow_from_directory(
'train/',
target_size=(512, 512),
batch_size=5,
class_mode="categorical"
)
valid_gen = gen.flow_from_directory(
'validation/',
target_size=(512, 512),
batch_size=5,
class_mode="categorical"
)