Resultados da pesquisa a pedido "scikit-learn"
Sklearn SGDClassifier ajuste parcial
Estou tentando usar o SGD para classificar um grande conjunto de dados. Como os dados são grandes demais para caber na memória, eu gostaria de usar oparcial_fit método para treinar o classificador. Selecionei uma amostra do conjunto de ...
Como capturar o valor de retorno com o módulo timeit do Python?
Estou executando vários algoritmos de aprendizado de máquina com o sklearn em um loop for e quero ver quanto tempo cada um deles leva. O problema é que eu também preciso retornar um valor e NÃO quero executá-lo mais de uma vez, pois ...
sklearn: Tenha um estimador que filtre amostras
Estou tentando implementar meu próprio Imputer. Sob certas condições, gostaria de filtrar algumas das amostras de trem (que considero de baixa qualidade). No entanto, desde otransform método retorna apenasX e nãoyey em si é uma matriz numpy (que ...
Prevendo valores ausentes com o módulo Imputer do scikit-learn
Estou escrevendo um programa muito básico para prever valores ausentes em um conjunto de dados usandoImputador de scikit-learnclasse. Eu criei uma matriz NumPy, criei um objeto Imputer com strategy = 'mean' e executei fit_transform () na matriz ...
ImportError: não é possível importar a opção de nome ao importar o sklearn.mixture
Estou usando o scikit learn 0.15.0. Quando tento importar o sklearn.mixture, obtenho ImportError: não é possível importar a escolha do nome Alguma ideia? ==================================================== ================= In [1]: **from ...
sklearn: obtenha nomes de recursos após a seleção de recursos baseada em L1
Esta pergunta e resposta [https://stackoverflow.com/questions/14133348/show-feature-names-after-feature-selection] demonstre que, quando a seleção de recursos é realizada usando uma das rotinas de seleção de recursos dedicadas do scikit-learn, os ...
Atualizando os nomes dos recursos no scikit TFIdfVectorizer
Estou testando este código from sklearn.feature_extraction.text import TfidfVectorizer import numpy as np train_data = ["football is the sport","gravity is the movie", "education is imporatant"] vectorizer = TfidfVectorizer(sublinear_tf=True, ...
scikit-learn: agrupando documentos de texto usando o DBSCAN
Estou tentando usar o scikit-learn para agrupar documentos de texto. No geral, encontro o caminho, mas tenho problemas com questões específicas. A maioria dos exemplos que encontrei ilustra o clustering usando o scikit-learn com k-means como ...
O GridSearchCV do scikit-learn pára de funcionar quando n_jobs> 1
Eu perguntei anteriormenteaqui [https://stackoverflow.com/questions/25249212/scikit-grid-search-for-knn-regression-valueerror-array-contains-nan-or-infinity] crie as seguintes linhas de código: parameters = [{'weights': ['uniform'], ...
Cálculo rápido do ganho de informações
Eu preciso calcularGanho de informaçãopontuações para> 100 mil recursos em> 10 mil documentos paraclassificação do texto. O código abaixo funciona bem, maspara o conjunto de dados completo é muito lento- leva mais de uma hora em um laptop. O ...