Resultados da pesquisa a pedido "deep-learning"
Usando uma incorporação de palavras pré-treinada (word2vec ou Glove) no TensorFlow
Revi recentemente uma implementação interessante paraclassificação de texto convolucional [http://www.wildml.com/2015/12/implementing-a-cnn-for-text-classification-in-tensorflow/] . No entanto, todo o código TensorFlow que revi usa vetores de ...
A velocidade entre a camada de dados ImageDataLayer e LMDB
O Caffe suporta a camada de dados LMDB e o ImageDataLayer. Criar banco de dados LMDB a partir de algum conjunto de dados requer algum tempo e muito espaço. Por outro lado, o ImageDataLayer usa apenas um arquivo txt, o que é muito conveniente. ...
Obtendo o formato de saída da camada de deconvolução usando tf.nn.conv2d_transpose no tensorflow
De acordo com issopapel [http://www.matthewzeiler.com/pubs/cvpr2010/cvpr2010.pdf], a forma de saída éN + H - 1, N é altura ou largura de entrada,H é a altura ou largura do kernel. Este é um processo inverso óbvio de convolução. ...
Incorporando o feedback do usuário em um modelo de ML
Eu desenvolvi um modelo de ML para uma tarefa de classificação (0/1) da PNL e o implantei no ambiente de produção. A previsão do modelo é exibida para os usuários, e os usuários têm a opção de fornecer um feedback (se a previsão estiver certa / ...
Técnicas de aumento de dados para conjuntos de dados de imagem pequena?
Atualmente, estou treinando pequenos conjuntos de dados de logotipo semelhantes aFlickrlogos-32 [http://www.multimedia-computing.de/flickrlogos/]com CNNs profundas. Para treinar redes maiores, preciso de mais conjunto de dados, usando o aumento. ...
Cálculo de gradiente para a versão softmax da perda de trigêmeos
Eu tenho tentado implementar a versão softmax da perda de trigêmeos em Caffe descrita em Hoffer e Ailon,Aprendizado métrico profundo usando rede tripla, ICLR 2015 [http://arxiv.org/pdf/1412.6622v3.pdf]. Eu tentei isso, mas acho difícil calcular ...
Recorte de perda no fluxo do tensor (no DQN do DeepMind)
Estou tentando minha própria implementação do documento DQN por Deepmind no fluxo tensorial e estou tendo dificuldades com o recorte da função de perda. Aqui está um trecho do documento da natureza que descreve o recorte de perda: Também ...
LSTM seguido por pool médio
Estou usando o Keras 1.0. Meu problema é idêntico a este (Como implementar uma camada de pool médio no Keras [https://stackoverflow.com/questions/35355528]), mas a resposta não parece suficiente para mim. Eu quero implementar esta rede: ...
Instantâneos do Caffe: .solverstate vs .caffemodel
Ao treinar uma rede, as capturas instantâneas tiradas a cada N iterações vêm de duas formas juntas. Um é o arquivo .solverstate, que eu presumo é exatamente o que parece, armazenando o estado das funções e gradientes de perda etc. O outro é o ...
Perda de entropia cruzada sigmóide de Caffe
Estou usando a função de perda de entropia cruzada sigmóide para um problema de classificação de vários rótulos, conforme definido poreste ...