В самом деле, это не должно иметь значения ... извините, я застрял, ck также по этому делу. В идеале вы должны предложить некоторый код, чтобы мы могли воспроизвести вашу проблему и помочь разобраться с ней :-)

Question

May 12, 2017, 02:48 PM

В самом деле, это не должно иметь значения ... извините, я застрял, ck также по этому делу. В идеале вы должны предложить некоторый код, чтобы мы могли воспроизвести вашу проблему и помочь разобраться с ней :-)

ользую Keras 2.0.4 (серверная часть TensorFlow) для задачи классификации изображений (на основе предварительно обученных моделей). Во время обучения / настройки я отслеживаю все используемые метрики (например,categorical_accuracy, categorical crossentropy) сCSVLogger - включая соответствующие метрики, связанные с набором проверки (т.е.val_categorical_accuracy, val_categorical_crossentropy).

С обратным вызовомModelCheckpoint Я отслеживаю лучшую конфигурацию весов (save_best_only=True). Для оценки модели на проверочном наборе я используюmodel.evaluate().

Мои ожидания: отслеживаемые показатели поCSVLogger («лучшей» эпохи) равны метрикам, рассчитаннымmodel.evaluate(), К сожалению, это не случай. Метрики отличаются + -5%, Есть ли причина для такого поведения?

РЕДАКТИРОВАТЬ:

После некоторого тестирования я мог получить некоторые идеи:

Если я не использую генератор для обучения и проверки данных (и, следовательно, нетmodel.fit_generator()), проблема не возникает. -> ИспользованиеImageDataGenerator для обучения и проверки данных является источником расхождения. (Обратите внимание, для расчетаevaluate I не использовать генератор, но яделать использовать те же данные проверки (по крайней мере, еслиDataImageGenerator будет работать как положено ...).
Я думаю, ImageDataGenerator не работает должным образом (пожалуйста, также посмотрите наэтот).Если я вообще не использую генераторы, такой проблемы не будет. Я отслеживал показатели поCSVLogger («лучшей» эпохи) равны метрикам, рассчитаннымmodel.evaluate().
Интересно, что есть еще одна проблема: если вы используете одни и те же данные для обучения и проверки, будет несоответствие между показателями обучения (например,loss) и метрики проверки (например,val_lossв конце каждой эпохи.
(Похожая проблема)

Используемый код:

############################ import section ############################
from __future__ import print_function # perform like in python 3.x
from keras.datasets import mnist
from keras.utils import np_utils # numpy utils for to_categorical()
from keras.models import Model, load_model
from keras.layers import Dense, GlobalAveragePooling2D, Dropout, GaussianDropout, Conv2D, MaxPooling2D
from keras.optimizers import SGD, Adam
from keras import backend as K
from keras.preprocessing.image import ImageDataGenerator 
from keras import metrics
import os
import sys
from scipy import misc
import numpy as np
from keras.applications.vgg16 import preprocess_input as vgg16_preprocess_input
from keras.applications import VGG16
from keras.callbacks import CSVLogger, ModelCheckpoint


############################ manual settings ###########################
# general settings
seed = 1337

loss_function = 'categorical_crossentropy'

learning_rate = 0.001

epochs = 10

batch_size = 20

nb_classes = 5 

img_width, img_height = 400, 400 # >= 48 necessary, as VGG16 is used

chosen_optimizer = SGD(lr=learning_rate, momentum=0.0, decay=0.0, nesterov=False)

steps_per_epoch = 40 // batch_size  # 40 train samples in 5 classes
validation_steps = 40 // batch_size # 40 train samples in 5 classes

data_dir = # TODO: set path where data is stored (folders: 'train', 'val', 'test'; within each folder are folders named by classes)

# callbacks: CSVLogger & ModelCheckpoint
filepath = # TODO: set path, where you want to store files generated by the callbacks
file_best_checkpoint= 'best_epoch.hdf5'
file_csvlogger = 'logged_metrics.txt'

modelcheckpoint_best_epoch= ModelCheckpoint(filepath=os.path.join(filepath, file_best_checkpoint), 
                                  monitor = 'val_loss' , verbose = 1, 
                                  save_best_only = True, 
                                  save_weights_only=False, mode='auto', 
                                  period=1) # every epoch executed
csvlogger = CSVLogger(os.path.join(filepath, file_csvlogger) , separator=',', append=False)



############################ prepare data ##############################
# get validation data (for evaluation)
X_val, Y_val = # TODO: load train data (4darray, samples, img_width, img_height, nb_channels) IMPORTANT: 5 classes with 8 images each.

# preprocess data
my_preprocessing_function = mf.my_vgg16_preprocess_input

# 'augmentation' configuration we will use for training
train_datagen = ImageDataGenerator(preprocessing_function = my_preprocessing_function) # only preprocessing; static data set

# 'augmentation' configuration we will use for validation
val_datagen = ImageDataGenerator(preprocessing_function = my_preprocessing_function) # only preprocessing; static data set

train_data_dir = os.path.join(data_dir, 'train')
validation_data_dir = os.path.join(data_dir, 'val')
train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    shuffle = True,
    seed = seed, # random seed for shuffling and transformations
    class_mode='categorical')  # label type (categorical = one-hot vector)

validation_generator = val_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    shuffle = True,
    seed = seed, # random seed for shuffling and transformations
    class_mode='categorical')  # label type (categorical = one-hot vector)



############################## training ###############################
print("\n---------------------------------------------------------------")
print("------------------------ training model -----------------------")
print("---------------------------------------------------------------")
# create the base pre-trained model
base_model = VGG16(include_top=False, weights = None, input_shape=(img_width, img_height, 3), pooling = 'max', classes = nb_classes)
model_name =  "VGG_modified"

# do not freeze any layers --> all layers trainable
for layer in base_model.layers:
    layer.trainable = True

# define topping of base_model
x = base_model.output # get the last layer of our base_model
x = Dense(1024, activation='relu', name='fc1')(x)
x = Dense(1024, activation='relu', name='fc2')(x)
predictions = Dense(nb_classes, activation='softmax', name='predictions')(x)

# finally, stack model together
model = Model(outputs=predictions, name= model_name, inputs=base_model.input) #Keras 1.x.x: model = Model(input=base_model.input, output=predictions) 
print(model.summary())

# compile the model (should be done *after* setting layers to non-trainable)
model.compile(optimizer = chosen_optimizer, loss=loss_function, 
            metrics=['categorical_accuracy','kullback_leibler_divergence'])

# train the model on your data
model.fit_generator(
    train_generator,
    steps_per_epoch=steps_per_epoch,
    epochs=epochs,
    validation_data=validation_generator,
    validation_steps=validation_steps,
    callbacks = [csvlogger, modelcheckpoint_best_epoch])



############################## evaluation ##############################
print("\n\n---------------------------------------------------------------")
print("------------------ Evaluation of Best Epoch -------------------")
print("---------------------------------------------------------------")
# load model (corresponding to best training epoch)
model = load_model(os.path.join(filepath, file_best_checkpoint))

# evaluate model on validation data (in test mode!)
list_of_metrics = model.evaluate(X_val, Y_val, batch_size=batch_size, verbose=1, sample_weight=None)
index = 0
print('\nMetrics:')
for metric in model.metrics_names:
    print(metric+ ':' , str(list_of_metrics[index]))
    index += 1

E D I T 2
Ссылаясь на 1. из E D I T: Если я использую тот же генератор для проверки данных во время обучения и оценки (с помощьюevaluate_generator()), проблема все еще возникает. Следовательно, это определенно проблема, вызванная генераторами ...

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы