Resultados da pesquisa a pedido "scikit-learn"

1 a resposta

Sklearn SGDClassifier ajuste parcial

Estou tentando usar o SGD para classificar um grande conjunto de dados. Como os dados são grandes demais para caber na memória, eu gostaria de usar oparcial_fit método para treinar o classificador. Selecionei uma amostra do conjunto de ...

5 a resposta

Como capturar o valor de retorno com o módulo timeit do Python?

Estou executando vários algoritmos de aprendizado de máquina com o sklearn em um loop for e quero ver quanto tempo cada um deles leva. O problema é que eu também preciso retornar um valor e NÃO quero executá-lo mais de uma vez, pois ...

2 a resposta

sklearn: Tenha um estimador que filtre amostras

Estou tentando implementar meu próprio Imputer. Sob certas condições, gostaria de filtrar algumas das amostras de trem (que considero de baixa qualidade). No entanto, desde otransform método retorna apenasX e nãoyey em si é uma matriz numpy (que ...

2 a resposta

Prevendo valores ausentes com o módulo Imputer do scikit-learn

Estou escrevendo um programa muito básico para prever valores ausentes em um conjunto de dados usandoImputador de scikit-learnclasse. Eu criei uma matriz NumPy, criei um objeto Imputer com strategy = 'mean' e executei fit_transform () na matriz ...

3 a resposta

ImportError: não é possível importar a opção de nome ao importar o sklearn.mixture

Estou usando o scikit learn 0.15.0. Quando tento importar o sklearn.mixture, obtenho ImportError: não é possível importar a escolha do nome Alguma ideia? ==================================================== ================= In [1]: **from ...

2 a resposta

sklearn: obtenha nomes de recursos após a seleção de recursos baseada em L1

Esta pergunta e resposta [https://stackoverflow.com/questions/14133348/show-feature-names-after-feature-selection] demonstre que, quando a seleção de recursos é realizada usando uma das rotinas de seleção de recursos dedicadas do scikit-learn, os ...

2 a resposta

Atualizando os nomes dos recursos no scikit TFIdfVectorizer

Estou testando este código from sklearn.feature_extraction.text import TfidfVectorizer import numpy as np train_data = ["football is the sport","gravity is the movie", "education is imporatant"] vectorizer = TfidfVectorizer(sublinear_tf=True, ...

2 a resposta

scikit-learn: agrupando documentos de texto usando o DBSCAN

Estou tentando usar o scikit-learn para agrupar documentos de texto. No geral, encontro o caminho, mas tenho problemas com questões específicas. A maioria dos exemplos que encontrei ilustra o clustering usando o scikit-learn com k-means como ...

2 a resposta

O GridSearchCV do scikit-learn pára de funcionar quando n_jobs> 1

Eu perguntei anteriormenteaqui [https://stackoverflow.com/questions/25249212/scikit-grid-search-for-knn-regression-valueerror-array-contains-nan-or-infinity] crie as seguintes linhas de código: parameters = [{'weights': ['uniform'], ...

3 a resposta

Cálculo rápido do ganho de informações

Eu preciso calcularGanho de informaçãopontuações para> 100 mil recursos em> 10 mil documentos paraclassificação do texto. O código abaixo funciona bem, maspara o conjunto de dados completo é muito lento- leva mais de uma hora em um laptop. O ...