Resultados da pesquisa a pedido "scikit-learn"
Aprendizado incremental no Scikit com o parcial_fit do PassiveAggressiveClassifier
Estou tentando treinar umPassiveAggressiveClassifier usandoTfidVectorizer compartial_fit técnica no script abaixo: Código atualizado: a, ta = [], [] r, tr = [], [] g = [] vect = HashingVectorizer(ngram_range=(1,4)) model = ...
Salvar e reutilizar o TfidfVectorizer no scikit learn
Estou usando o TfidfVectorizer no scikit learn para criar uma matriz a partir de dados de texto. Agora preciso salvar esse objeto para reutilizá-lo mais tarde. Eu tentei usar pickle, mas deu o seguinte erro. loc=open('vectorizer.obj','w') ...
Como especificar a probabilidade anterior de Naive Bayes do scikit-learn
Estou usando a biblioteca de aprendizado de máquina scikit-learn (Python) para um projeto de aprendizado de máquina. Um dos algoritmos que estou usando é a implementação Gaussian Naive Bayes. Um dos atributos doGaussianNB ()A função é ...
Como funciona o parâmetro class_weight no scikit-learn?
Estou tendo muitos problemas para entender como oclass_weight O parâmetro na Regressão logística do scikit-learn opera. A situação Eu quero usar a regressão logística para fazer a classificação binária em um conjunto de dados muito ...
Devo usar `random.seed` ou` numpy.random.seed` para controlar a geração de números aleatórios no `scikit-learn`?
Estou usando o scikit-learn e numpy e quero definir a semente global para que meu trabalho seja reprodutível. Devo usarnumpy.random.seed ourandom.seed? Editar:Pelo link nos comentários, entendo que eles são diferentes e que a versão numpy não é ...
sklearn: como obter coeficientes de recursos polinomiais
Eu sei que é possível obter os recursos polinomiais como números usando:polynomial_features.transform(X). De acordo ...
Erro sklearn ValueError: A entrada contém NaN, infinito ou um valor muito grande para o tipo (d 'float64')
Estou usando o sklearn e estou tendo um problema com a propagação de afinidade. Eu construí uma matriz de entrada e continuo recebendo o seguinte erro. ValueError: Input contains NaN, infinity or a value too large for dtype('float64').eu ...
Scikit-learn: Como obter Verdadeiro Positivo, Verdadeiro Negativo, Falso Positivo e Falso Negativo
Meu problema: Eu tenho um conjunto de dados que é um arquivo JSON grande. Eu o leio e guardo notrainList variável. Em seguida, pré-processo - para poder trabalhar com ele. Depois de fazer isso, inicio a classificação: Eu uso okfold método de ...
sklearn LogisticRegression e alterando o limite padrão para classificação
Estou usando LogisticRegression do pacote sklearn e tenho uma pergunta rápida sobre classificação. Eu construí uma curva ROC para o meu classificador e o limite ideal para meus dados de treinamento é de cerca de 0,25. Estou assumindo que o limite ...
Como calcular precisão, recall, exatidão e pontuação f1 para o caso multiclasse com o scikit learn?
Estou trabalhando em um problema de análise de sentimentos, com os dados assim: label instances 5 1190 4 838 3 239 1 204 2 127Portanto, meus dados estão desequilibrados desde 1190instances são rotulados com5. Para a classificação, estou usando ...