Resultados da pesquisa a pedido "scikit-learn"
Soma sobre linhas em scipy.sparse.csr_matrix
Eu tenho um csr_matrix grande e quero adicionar linhas e obter um novo csr_matrix com o mesmo número de colunas, mas com um número reduzido de linhas. (Contexto: a matriz é uma matriz de termo de documento obtida do sklearn CountVectorizer e ...
Extrair índices de uma matriz NumPy
Eu tenho uma matriz NumPy que consiste apenas nos elementos 0 e 1 da seguinte maneira: import numpy as np data = np.array([[1, 1 , 0 , 0 , 0 , 0 , 1 , 0], [1, 1 , 1 , 1 , 1 , 1 , 1 , 0], [1, 1 , 1 , 1 , 1 , 1 , 1 , 0], [0, 0 , 1 , 1 , **1** , 1 ...
Problemas na obtenção dos recursos mais informativos com o scikit learn?
Estou tentando obter os recursos mais informativos de umcorpus textual [http://pastebin.com/3qYc9mfZ]. Deste bem respondidoPergunta, ...
TypeError: get_params () ausente 1 argumento posicional necessário: 'self'
Eu estava tentando usarscikit-learn pacote com python-3.4 para fazer uma pesquisa em grade, from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model.logistic import LogisticRegression from sklearn.pipeline import ...
Traçar uma curva ROC no scikit produz apenas 3 pontos
TLDR: scikit'sroc_curve A função está retornando apenas 3 pontos para um determinado conjunto de dados. Por que isso pode acontecer e como controlamos quantos pontos voltar? Estou tentando desenhar uma curva ROC, mas sempre recebo um "triângulo ...
Como listar todos os classificadores scikit-learn que oferecem suporte a predict_proba ()
Preciso de uma lista de todos os classificadores scikit-learn que suportam o método predict_proba (). Como a documentação não fornece uma maneira fácil de obter essas informações, como obtê-las programaticamente?
Como obter o melhor estimador no GridSearchCV (Random Forest Classifier Scikit)
Estou executando o GridSearch CV para otimizar os parâmetros de um classificador no scikit. Quando terminar, gostaria de saber quais parâmetros foram escolhidos como os melhores. Sempre que faço isso, recebo umaAttributeError: ...
classificadores no scikit-learn que manipulam nan / null
Eu queria saber se existem classificadores que lidam com valores nan / nulos no scikit-learn. Eu pensei que o regressor de floresta aleatório lida com isso, mas recebi um erro quando ligopredict. X_train = np.array([[1, np.nan, 3],[np.nan, 5, ...
RandomForestClassfier.fit (): ValueError: não foi possível converter a string em flutuante
Dado é um arquivo CSV simples: A,B,C Hello,Hi,0 Hola,Bueno,1Obviamente, o conjunto de dados real é muito mais complexo que isso, mas este reproduz o erro. Estou tentando criar um classificador de floresta aleatório para ele, assim: cols = ...
Erro ao importar os módulos scikit-learn
Estou tentando chamar uma função do módulo de cluster, assim: import sklearn db = sklearn.cluster.DBSCAN()e recebo o seguinte erro: AttributeError: 'module' object has no attribute 'cluster'Conclusão de tabulação no IPython, parece que tenho ...