Resultados da pesquisa a pedido "scikit-learn"
Usando o scikit para determinar as contribuições de cada recurso para uma previsão de classe específica
Estou usando um classificador de árvores extras do scikit: model = ExtraTreesClassifier(n_estimators=10000, n_jobs=-1, random_state=0) Quando o modelo é ajustado e usado para prever classes, gostaria de descobrir as contribuições de cada recurso ...
python - TypeError: tipos desordenados: str ()> float ()
Eu tenho um arquivo CSV e tem coluna v3, mas essa coluna tem algumas linhas 'nan'. Como posso, exceto as linhas. dataset = pd.read_csv('mypath') enc = LabelEncoder() enc.fit(dataset['v3']) print('fitting') dataset['v3'] = ...
Matriz Precision / Recall / F1 e Matriz de Confusão Tensorflow
Gostaria de saber se existe uma maneira de implementar a função score diferente do pacote scikit learn como este: from sklearn.metrics import confusion_matrix confusion_matrix(y_true, y_pred)em um modelo de tensorflow para obter a pontuação ...
ValueError: matrizes encontradas com números inconsistentes de amostras [6 1786]
Aqui está o meu código: from sklearn.svm import SVC from sklearn.grid_search import GridSearchCV from sklearn.cross_validation import KFold from sklearn.feature_extraction.text import TfidfVectorizer from sklearn import datasets import numpy as ...
Atualizar / instalar o Python scikit aprender a versão mais recente do desenvolvimento no Windows
Estou tentando substituir / instalar meu scikit learn 0.17.0 da Python com a versão de desenvolvimento 0.18.dev0 mais recente do Windows, para que eu possa tentar "sklearn.neural_network.MLPClassifier". Depois de ler e experimentar o manual do ...
Como atualizar um modelo SVM com novos dados
Eu tenho dois conjuntos de dados com tamanho diferente. 1) O conjunto de dados 1 possui 4500 amostras de grandes dimensões (esboços). 2) O conjunto de dados 2 possui 1000 amostras de baixa dimensão (dados reais). Suponho que "os dois conjuntos ...
linha de regressão confusa do gráfico de dispersão: Python
No python 2.7.6, matlablib, scikit learn 0.17.0, Quando eu faço uma linha de regressão polinomial em um gráfico de dispersão, a curva polinomial fica muito confusa assim: [/imgs/XVAZQ.jpg] O script é assim: ele lê duas colunas de dados ...
Como calculo uma matriz de co-ocorrência palavra-palavra com o sklearn?
Estou procurando um módulo no sklearn que permita derivar a matriz de co-ocorrência palavra-palavra. Consigo obter a matriz termo do documento, mas não sei como obter uma matriz palavra-palavra de co-ocorrências.
Como passar um parâmetro para apenas uma parte de um objeto de pipeline no scikit learn?
Eu preciso passar um parâmetrosample_weight, para o meuRandomForestClassifier igual a: X = np.array([[2.0, 2.0, 1.0, 0.0, 1.0, 3.0, 3.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 5.0, 3.0, 2.0, ...
Numpy desenho da urna
Quero executar um sorteio relativamente simples numpy, mas não consigo encontrar uma boa maneira de expressá-lo. Eu acho que a melhor maneira é descrevê-lo como um desenho de uma urna sem substituição. Eu tenho uma urna com k cores e n_k bolas de ...