https://github.com/nanopony/keras-convautoencoder/blob/master/autoencoder_layers.py.

лизовал в Керасе связанный кодировщик веса и успешно обучил его.

Моя цель состоит в том, чтобы использовать только часть декодера Авто-кодера в качестве последнего уровня другой сети, чтобы точно настроить и сеть, и декодер.

Дело в том, что, как вы можете видеть ниже из сводки, декодер не имеет параметров с моей реализацией связанных весов, поэтому нет ничего, что можно было бы точно настроить. (decoder.get_weights() возвращается[])

Мой вопрос: должен ли я изменить реализацию связанных весов, чтобы связанный слой все еще мог содержать веса, то есть транспонированные веса кодера? Если да, то как?

Или я просто далеко?

Ниже приведена сводная информация о модели автоэнкодера, а также о классе связанного плотного слоя (слегка измененный сhttps://github.com/nanopony/keras-convautoencoder/blob/master/autoencoder_layers.py.)

Layer (type)                     Output Shape          Param #     Connected to                     
====================================================================================================
encoded (Dense)                  (None, Enc_dim)          33000       dense_input_1[0][0]              
____________________________________________________________________________________________________
tieddense_1 (TiedtDense)          (None, Out_Dim)            0           encoded[0][0]                    
====================================================================================================
Total params: 33,000
Trainable params: 33,000
Non-trainable params: 0
________________________________________________________________________


class TiedtDense(Dense):
def __init__(self, output_dim, master_layer, init='glorot_uniform', activation='linear', weights=None,
             W_regularizer=None, b_regularizer=None, activity_regularizer=None,
             W_constraint=None, b_constraint=None, input_dim=None, **kwargs):
    self.master_layer = master_layer
    super(TiedtDense, self).__init__(output_dim, **kwargs)

def build(self, input_shape):
    assert len(input_shape) >= 2
    input_dim = input_shape[-1]
    self.input_dim = input_dim


    self.W = tf.transpose(self.master_layer.W)
    self.b = K.zeros((self.output_dim,))
    self.params = [self.b]
    self.regularizers = []
    if self.W_regularizer:
        self.W_regularizer.set_param(self.W)
        self.regularizers.append(self.W_regularizer)

    if self.b_regularizer:
        self.b_regularizer.set_param(self.b)
        self.regularizers.append(self.b_regularizer)

    if self.activity_regularizer:
        self.activity_regularizer.set_layer(self)
        self.regularizers.append(self.activity_regularizer)

    if self.initial_weights is not None:
        self.set_weights(self.initial_weights)
        del self.initial_weights

Ответы на вопрос(0)

Ваш ответ на вопрос