Resultados da pesquisa a pedido "scikit-learn"
PCA incremental em big data
Eu apenas tentei usar o IncrementalPCA do sklearn.decomposition, mas ele lançou um MemoryError assim como o PCA e o RandomizedPCA antes. Meu problema é que a matriz que estou tentando carregar é muito grande para caber na RAM. No momento, ele é ...
regressão polinomial usando python
Pelo que entendi, a regressão polinomial é um tipo específico de análise de regressão, que é mais complicado que a regressão linear. Existe um módulo python que pode fazer isso? Procurei em matplotlib, scikitand numpy, mas só consigo encontrar ...
Scikit-learn train_test_split com índices
Como obtenho os índices originais dos dados ao usar train_test_split ()? O que eu tenho é o seguinte from sklearn.cross_validation import train_test_split import numpy as np data = np.reshape(np.randn(20),(10,2)) # 10 training examples labels ...
Como paralelizar o método .predict () de um classificador SVM (SVC) do scikit-learn?
Recentemente me deparei com um requisito de que tenho um.fit() treinadoscikit-learn SVCInstância do classificador e precisa.predict()muitas instâncias. Existe uma maneira de paralelizar apenas isso.predict() método por qualquerscikit-learn ...
Sklearn: Diferença entre usar o OneVsRestClassifier e criar cada classificador individualmente
Até onde eu sei, o problema com vários rótulos pode ser resolvido com o esquema one-vs-all, para o qual o Scikit-learn implementaOneVsRestClassifier como um invólucro no classificador, comosvm.SVC. Estou imaginando como seria diferente se eu ...
Criar eficientemente tabelas dinâmicas esparsas em pandas?
Estou trabalhando para transformar uma lista de registros com duas colunas (A e B) em uma representação matricial. Eu tenho usado a função de pivô dentro dos pandas, mas o resultado acaba sendo bastante grande. Os pandas suportam a rotação em um ...
Fazendo o SVM rodar mais rápido em python
Usando ocódigoabaixo para svm em python: from sklearn import datasets from sklearn.multiclass import OneVsRestClassifier from sklearn.svm import SVC iris = datasets.load_iris() X, y = iris.data, iris.target clf = ...
Carregar dados do classificador em conserva: vocabulário não ajustado Erro
Eu li todas as perguntas relacionadas aqui, mas não consegui encontrar uma solução funcional: Minha criação do classificador: class StemmedTfidfVectorizer(TfidfVectorizer): def build_analyzer(self): analyzer = super(TfidfVectorizer, ...
Por que obtenho um ImportError ao criar um .exe com o pyinstaller?
Acabei de criar um pequeno programa GUI que compila e funciona bem no IPython, mas quando tento exportá-lo para um.exe usando pyinstaller, isso me dá um erro de importação. Tenho certeza que ésklearn porque quando eu comento osklearn importa meu ...
Como usar o CountVectorizerand () do sklearn para obter ngrams que incluem qualquer pontuação como tokens separados?
eu usosklearn.feature_extraction.text.CountVectorizer [http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html] para calcular n-gramas. Exemplo: import sklearn.feature_extraction.text # ...