Resultados da pesquisa a pedido "machine-learning"

1 a resposta

apache spark MLLib: como construir pontos rotulados para recursos de string?

Estou tentando criar um classificador NaiveBayes com o MLLib do Spark, que usa como entrada um conjunto de documentos. Gostaria de colocar algumas coisas como recursos (ou seja, autores, tags explícitas, palavras-chave implícitas, categoria), ...

4 a resposta

Definindo um conjunto (inicial) de recursos semelhantes ao Haar

Quando se trata de classificadores em cascata (usando recursos do tipo haar), sempre leio que métodos como o AdaBoosting são usados para selecionar os 'melhores' recursos para detecção. No entanto, isso só funciona se houver algum conjunto ...

1 a resposta

Encontrar vizinhos K-mais próximos e sua implementação

Estou trabalhando na classificação de dados simples usando o KNN com distância euclidiana. Eu vi um exemplo do que eu gostaria de fazer que é feito com o MATLABknnsearch função como mostrado abaixo: load fisheriris x = meas(:,3:4); ...

2 a resposta

Como obter um código hash como número inteiro em R?

O que eu quero fazer é implementar um truque de hash em R. Código abaixo: library(digest) a<-digest("key_a", algo='xxhash32') #[1] "4da5b0f8"Isso retornou um código de hash em um tipo de caractere. Existe alguma maneira de transformá-lo em um ...

3 a resposta

Ajuste de parâmetros para o algoritmo de aprendizado Perceptron

Estou tendo um problema ao tentar descobrir como ajustar os parâmetros do meu algoritmo perceptron para que ele funcione relativamente bem em dados não vistos. Eu implementei um algoritmo de perceptron de trabalho verificado e gostaria ...

4 a resposta

Compreendendo min_df e max_df no scikit CountVectorizer

Eu tenho cinco arquivos de texto inseridos em um CountVectorizer. Ao especificar min_df e max_df para a instância CountVectorizer, o que significa exatamente a frequência mínima / máxima do documento? É a frequência de uma palavra em seu arquivo ...

1 a resposta

(Python - sklearn) Como passar parâmetros para a classe ModelTransformer customizada por gridsearchcv

Abaixo está o meu pipeline e parece que não consigo passar os parâmetros para meus modelos usando a classe ModelTransformer, que eu utilizo no link ...

2 a resposta

Como lidar com NaNs ausentes para aprendizado de máquina em python

Como lidar com valores ausentes nos conjuntos de dados antes de aplicar o algoritmo de aprendizado de máquina ??. Percebi que não é inteligente descartar os valores NAN ausentes. Geralmente interpolo (calcula a média) usando pandas e preenche os ...

1 a resposta

Qual é a diferença entre SVC e SVM no scikit-learn?

Dedocumentação [http://scikit-learn.org/stable/modules/svm.html]O scikit-learn implementa SVC, NuSVC e LinearSVC, que são classes capazes de executar a classificação multi-classe em um conjunto de dados. Por outro lado, eu também li sobre o ...

2 a resposta

word2vec: amostragem negativa (em termos leigos)?

Estou lendo o artigo abaixo e tenho alguns problemas, entendendo o conceito de amostragem negativa. http://arxiv.org/pdf/1402.3722v1.pdf [http://arxiv.org/pdf/1402.3722v1.pdf] Alguém pode ajudar por favor?