Use keras (TensorFlow) para construir un modelo Conv2D + LSTM

Question

Nov 24, 2017, 10:42 AM

Use keras (TensorFlow) para construir un modelo Conv2D + LSTM

Los datos son 10 videos y cada video se divide en 86 cuadros y cada cuadro tiene 28 * 28 píxeles,

video_num = 10
frame_num = 86
pixel_num = 28*28

Quiero usar Conv2D + LSDM para construir el Modelo, y en cada paso de tiempo (= frame_num = 86) enviar los datos de píxeles (= INPUT_SIZE = 28 * 28) en el modelo. Entonces, el siguiente es mi código sobre el Modelo

BATCH_SIZE = 2 (just try)
TIME_STEPS=frame_num (=86)
INPUT_SIZE=pixel_num (=28*28)

model = Sequential()
model.add(InputLayer(batch_input_shape=(BATCH_SIZE, TIME_STEPS,     
INPUT_SIZE)))
print (model.output_shape)

model.add(TimeDistributed(Conv2D(64,(1,3),strides=(1,1), padding='same', 
data_format='channels_last')))  ##always the error here
print (model.output_shape)

model.add(TimeDistributed(MaxPooling2D(pool_size=(2,2),padding='same')))
print (model.output_shape)

model.add(TimeDistributed(Conv2D(64,(1,3),strides=(1,1), 
data_format='channels_last', padding='same')))
print (model.output_shape)

model.add(TimeDistributed(MaxPooling2D(pool_size=(2,2),padding='same')))
print (model.output_shape)

model.add(TimeDistributed(Flatten()))
print (model.output_shape)

model.add(TimeDistributed(Dense(4096, activation='relu')))
print (model.output_shape)

model.add(LSTM(100, stateful=True, return_sequences=True))
print (model.output_shape)

model.add(Dense(1, activation='sigmoid'))
print (model.output_shape)

la siguiente figura muestra el error de la línea de comando

https://imgur.com/a/yAPQO dice "índice de lista fuera de rango"

Creo que el error se trata de la forma de entrada en TimeDistributed () que obtiene la entrada de la capa superior (InputLayer ()), pero no tengo idea de cómo solucionar el error. He intentado eliminar InputLayer () y usar

TimeDistributed(Conv2D(...), input_shape=(TIME_STEPS, INPUT_SIZE))

como la primera capa, pero también aparece el mismo error ...

Si alguien conoce este error, comparta su idea, se lo agradeceré mucho. Además, todavía no tenía muy clara la diferencia entre batch_input_shape y input_shape, ¿alguien usó estos dos antes? Gracias.