Resultados da pesquisa a pedido "gradient-descent"
Sklearn SGDClassifier ajuste parcial
Estou tentando usar o SGD para classificar um grande conjunto de dados. Como os dados são grandes demais para caber na memória, eu gostaria de usar oparcial_fit método para treinar o classificador. Selecionei uma amostra do conjunto de ...
Spark mllib prevendo número estranho ou NaN
Eu sou novo no Apache Spark e estou tentando usar a biblioteca de aprendizado de máquina para prever alguns dados. Meu conjunto de dados agora é de apenas cerca de 350 pontos. Aqui estão 7 desses pontos: "365","4",41401.387,5330569 ...
Onde posso ver o loop principal de descida do gradiente TensorFlow?
(Desculpe se isso soa um pouco ingênuo) Eu quero dar uma olhada na carne do TensorFlow [https://github.com/tensorflow/tensorflow/blob/deff101b27e2d3d2d0f68417991e9183bdcd3256/tensorflow/python/training/gradient_descent.py] implementação para ...
Como interpretar o caffe log com debug_info?
Ao enfrentar dificuldades durante o treinamento (nans [https://stackoverflow.com/a/33980220/1714410], perda não converge [https://stackoverflow.com/q/41234297/1714410]etc.) às vezes é útil olhar para um registro de treinamento mais detalhado, ...
Seleção do tamanho do mini lote para regressão de rede neural
Estou fazendo uma regressão de rede neural com 4 recursos. Como determino o tamanho do mini lote para o meu problema? Vejo pessoas usarem tamanho de lote de 100 a 1000 para visão computacional, com recursos de 32 * 32 * 3 para cada imagem, isso ...
Caffe: o que acontecerá se duas camadas suportarem gradientes no mesmo blob inferior?
Gostaria de saber se eu tenho uma camada gerando um blob inferior que é ainda mais consumido por duas camadas subseqüentes, as quais geram alguns gradientes para preencher bottom.diff no estágio de propagação traseira. Os dois gradientes serão ...
Como acumular gradientes no fluxo tensorial?
Eu tenho uma pergunta parecida comeste [https://stackoverflow.com/questions/42156957/how-to-update-model-parameters-with-accumulated-gradients] . Como tenho recursos limitados e trabalho com um modelo profundo (VGG-16) - usado para treinar uma ...
Como alternar operações de trem no fluxo tensor?
Estou implementando um esquema de treinamento alternado. O gráfico contém duas operações de treinamento. O treinamento deve alternar entre estes. Isso é relevante para pesquisas comoesta [https://arxiv.org/abs/1611.08408]ou esta ...
Onde está o código para a descida do gradiente?
Ao executar alguns experimentos com o TensorFlow, você deseja examinar a implementação de algumas funções apenas para ver exatamente como algumas coisas são feitas, iniciadas com o caso simples detf.train.GradientDescentOptimizer. Baixou o zip do ...