Resultados da pesquisa a pedido "deep-learning"

4 a resposta

Usando uma incorporação de palavras pré-treinada (word2vec ou Glove) no TensorFlow

Revi recentemente uma implementação interessante paraclassificação de texto convolucional [http://www.wildml.com/2015/12/implementing-a-cnn-for-text-classification-in-tensorflow/] . No entanto, todo o código TensorFlow que revi usa vetores de ...

2 a resposta

A velocidade entre a camada de dados ImageDataLayer e LMDB

O Caffe suporta a camada de dados LMDB e o ImageDataLayer. Criar banco de dados LMDB a partir de algum conjunto de dados requer algum tempo e muito espaço. Por outro lado, o ImageDataLayer usa apenas um arquivo txt, o que é muito conveniente. ...

3 a resposta

Obtendo o formato de saída da camada de deconvolução usando tf.nn.conv2d_transpose no tensorflow

De acordo com issopapel [http://www.matthewzeiler.com/pubs/cvpr2010/cvpr2010.pdf], a forma de saída éN + H - 1, N é altura ou largura de entrada,H é a altura ou largura do kernel. Este é um processo inverso óbvio de convolução. ...

2 a resposta

Incorporando o feedback do usuário em um modelo de ML

Eu desenvolvi um modelo de ML para uma tarefa de classificação (0/1) da PNL e o implantei no ambiente de produção. A previsão do modelo é exibida para os usuários, e os usuários têm a opção de fornecer um feedback (se a previsão estiver certa / ...

2 a resposta

Técnicas de aumento de dados para conjuntos de dados de imagem pequena?

Atualmente, estou treinando pequenos conjuntos de dados de logotipo semelhantes aFlickrlogos-32 [http://www.multimedia-computing.de/flickrlogos/]com CNNs profundas. Para treinar redes maiores, preciso de mais conjunto de dados, usando o aumento. ...

2 a resposta

Cálculo de gradiente para a versão softmax da perda de trigêmeos

Eu tenho tentado implementar a versão softmax da perda de trigêmeos em Caffe descrita em Hoffer e Ailon,Aprendizado métrico profundo usando rede tripla, ICLR 2015 [http://arxiv.org/pdf/1412.6622v3.pdf]. Eu tentei isso, mas acho difícil calcular ...

3 a resposta

Recorte de perda no fluxo do tensor (no DQN do DeepMind)

Estou tentando minha própria implementação do documento DQN por Deepmind no fluxo tensorial e estou tendo dificuldades com o recorte da função de perda. Aqui está um trecho do documento da natureza que descreve o recorte de perda: Também ...

5 a resposta

LSTM seguido por pool médio

Estou usando o Keras 1.0. Meu problema é idêntico a este (Como implementar uma camada de pool médio no Keras [https://stackoverflow.com/questions/35355528]), mas a resposta não parece suficiente para mim. Eu quero implementar esta rede: ...

1 a resposta

Instantâneos do Caffe: .solverstate vs .caffemodel

Ao treinar uma rede, as capturas instantâneas tiradas a cada N iterações vêm de duas formas juntas. Um é o arquivo .solverstate, que eu presumo é exatamente o que parece, armazenando o estado das funções e gradientes de perda etc. O outro é o ...

1 a resposta

Perda de entropia cruzada sigmóide de Caffe

Estou usando a função de perda de entropia cruzada sigmóide para um problema de classificação de vários rótulos, conforme definido poreste ...