El aprendizaje profundo es malo para ajustar funciones simples no lineales fuera del alcance del entrenamiento?
stoy tratando de crear un modelo simple basado en el aprendizaje profundo para predeciry=x**2
Pero parece que el aprendizaje profundo no puede aprender la función general fuera del alcance de su conjunto de entrenamiento.
e manera intuitiva, puedo pensar que la red neuronal podría no ajustarse a y = x ** 2 ya que no hay multiplicación involucrada entre las entradas.
Tenga en cuenta que no estoy preguntando cómo crear un modelo que se ajuste ax**2
. Ya lo he logrado. Quiero saber las respuestas a las siguientes preguntas:
Path para completar el cuaderno:https: //github.com/krishansubudhi/MyPracticeProjects/blob/master/KerasBasic-nonlinear.ipyn
input de entrenamiento:
x = np.random.random((10000,1))*1000-500
y = x**2
x_train= x
código de entrenamiento
def getSequentialModel():
model = Sequential()
model.add(layers.Dense(8, kernel_regularizer=regularizers.l2(0.001), activation='relu', input_shape = (1,)))
model.add(layers.Dense(1))
print(model.summary())
return model
def runmodel(model):
model.compile(optimizer=optimizers.rmsprop(lr=0.01),loss='mse')
from keras.callbacks import EarlyStopping
early_stopping_monitor = EarlyStopping(patience=5)
h = model.fit(x_train,y,validation_split=0.2,
epochs= 300,
batch_size=32,
verbose=False,
callbacks=[early_stopping_monitor])
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
dense_18 (Dense) (None, 8) 16
_________________________________________________________________
dense_19 (Dense) (None, 1) 9
=================================================================
Total params: 25
Trainable params: 25
Non-trainable params: 0
_________________________________________________________________
Evaluación en conjunto de pruebas aleatorias
El aprendizaje profundo en este ejemplo no es bueno para predecir una función no lineal simple. Pero bueno para predecir valores en el espacio muestral de datos de entrenamiento.