Resultados da pesquisa a pedido "scikit-learn"

4 a resposta

Aprendizado incremental no Scikit com o parcial_fit do PassiveAggressiveClassifier

Estou tentando treinar umPassiveAggressiveClassifier usandoTfidVectorizer compartial_fit técnica no script abaixo: Código atualizado: a, ta = [], [] r, tr = [], [] g = [] vect = HashingVectorizer(ngram_range=(1,4)) model = ...

1 a resposta

Salvar e reutilizar o TfidfVectorizer no scikit learn

Estou usando o TfidfVectorizer no scikit learn para criar uma matriz a partir de dados de texto. Agora preciso salvar esse objeto para reutilizá-lo mais tarde. Eu tentei usar pickle, mas deu o seguinte erro. loc=open('vectorizer.obj','w') ...

2 a resposta

Como especificar a probabilidade anterior de Naive Bayes do scikit-learn

Estou usando a biblioteca de aprendizado de máquina scikit-learn (Python) para um projeto de aprendizado de máquina. Um dos algoritmos que estou usando é a implementação Gaussian Naive Bayes. Um dos atributos doGaussianNB ()A função é ...

1 a resposta

Como funciona o parâmetro class_weight no scikit-learn?

Estou tendo muitos problemas para entender como oclass_weight O parâmetro na Regressão logística do scikit-learn opera. A situação Eu quero usar a regressão logística para fazer a classificação binária em um conjunto de dados muito ...

1 a resposta

Devo usar `random.seed` ou` numpy.random.seed` para controlar a geração de números aleatórios no `scikit-learn`?

Estou usando o scikit-learn e numpy e quero definir a semente global para que meu trabalho seja reprodutível. Devo usarnumpy.random.seed ourandom.seed? Editar:Pelo link nos comentários, entendo que eles são diferentes e que a versão numpy não é ...

2 a resposta

sklearn: como obter coeficientes de recursos polinomiais

Eu sei que é possível obter os recursos polinomiais como números usando:polynomial_features.transform(X). De acordo ...

11 a resposta

Erro sklearn ValueError: A entrada contém NaN, infinito ou um valor muito grande para o tipo (d 'float64')

Estou usando o sklearn e estou tendo um problema com a propagação de afinidade. Eu construí uma matriz de entrada e continuo recebendo o seguinte erro. ValueError: Input contains NaN, infinity or a value too large for dtype('float64').eu ...

11 a resposta

Scikit-learn: Como obter Verdadeiro Positivo, Verdadeiro Negativo, Falso Positivo e Falso Negativo

Meu problema: Eu tenho um conjunto de dados que é um arquivo JSON grande. Eu o leio e guardo notrainList variável. Em seguida, pré-processo - para poder trabalhar com ele. Depois de fazer isso, inicio a classificação: Eu uso okfold método de ...

2 a resposta

sklearn LogisticRegression e alterando o limite padrão para classificação

Estou usando LogisticRegression do pacote sklearn e tenho uma pergunta rápida sobre classificação. Eu construí uma curva ROC para o meu classificador e o limite ideal para meus dados de treinamento é de cerca de 0,25. Estou assumindo que o limite ...

4 a resposta

Como calcular precisão, recall, exatidão e pontuação f1 para o caso multiclasse com o scikit learn?

Estou trabalhando em um problema de análise de sentimentos, com os dados assim: label instances 5 1190 4 838 3 239 1 204 2 127Portanto, meus dados estão desequilibrados desde 1190instances são rotulados com5. Para a classificação, estou usando ...