Чтобы получить путаницу из тестовых данных, вы должны выполнить два шага:
- Сделайте прогнозы для тестовых данных
Например, используйте model.predict_generator
для прогнозирования первых 2000 вероятностей из тестового генератора.
generator = datagen.flow_from_directory(
'data/test',
target_size=(150, 150),
batch_size=16,
class_mode=None, # only data, no labels
shuffle=False) # keep data in same order as labels
probabilities = model.predict_generator(generator, 2000)
- Вычислить матрицу путаницы на основе прогнозов меток
Например, сравните вероятности со случаем, что на 1000 кошек и 1000 собак соответственно.
from sklearn.metrics import confusion_matrix
y_true = np.array([0] * 1000 + [1] * 1000)
y_pred = probabilities > 0.5
confusion_matrix(y_true, y_pred)
Дополнительное примечание о данных испытаний и проверки
Документация Keras использует три различных набора данных: данные обучения, данные проверки и данные испытаний. Данные обучения используются для оптимизации параметров модели. Данные проверки используются для выбора мета-параметров, например, количества эпох. После оптимизации модели с оптимальными мета-параметрами тестовые данные используются для получения достоверной оценки производительности модели.