Resultados da pesquisa a pedido "scikit-learn"
Problemas com a codificação binária one-hot (one-of-K) em python
A codificação binária one-hot (também conhecida como one-of-K) consiste em criar uma coluna binária para cada valor distinto de uma variável categórica. Por exemplo, se alguém possui uma coluna de cores (variável categórica) que aceita os valores ...
Usando arquivos Memmap para processamento em lote
Eu tenho um grande conjunto de dados no qual desejo o PCA. Estou limitado pela RAM e pela eficácia computacional do PCA. Portanto, passei a usar o PCA iterativo. Tamanho do conjunto de dados- ...
Como explorar uma árvore de decisão criada usando o scikit learn
Estou construindo uma árvore de decisão usando clf = tree.DecisionTreeClassifier() clf = clf.fit(X_train, Y_train)Tudo isso funciona bem. No entanto, como faço para explorar a árvore de decisão? Por exemplo, como localizo quais entradas do ...
Erros encontrados no parcial_fit no scikit learn
No treinamento com uma função parcial_fit no scikit learn, recebo o seguinte erro sem o término do programa, como isso é possível e quais são as repetições disso, mesmo que o modelo treinado se comporte corretamente e dê a saída correta. Isso é ...
Diferentes tipos de recursos para treinar Naive Bayes em Python Pandas
Eu gostaria de usar vários recursos para treinar com o classificador Naive Bayes para classificar 'A' ou 'não-A'. Eu tenho três recursos de tipos de valores diferentes: 1) comprimento total - em número inteiro positivo 2) relação de vogal - em ...
O scikit do Python aprende o corte de pca.explained_variance_ratio_
Guru, Ao escolher o número de componentes principais (k), escolhemos k como o menor valor, de modo que, por exemplo, 99% da variação seja retido. No entanto, no aprendizado do Python Scikit, não tenho 100% de ...
sklearn: Como redefinir um objeto Regressor ou classificador no sknn
Eu defini um regressor da seguinte maneira: nn1 = Regressor( layers=[ Layer("Rectifier", units=150), Layer("Rectifier", units=100), Layer("Linear")], regularize="L2", # dropout_rate=0.25, learning_rate=0.01, valid_size=0.1, ...
Trabalhos paralelos não terminam no GridSearchCV do scikit-learn
No script a seguir, estou descobrindo que os trabalhos iniciados pelo GridSearchCV parecem travar. import json import pandas as pd import numpy as np import unicodedata import re from sklearn.pipeline import Pipeline from ...
Padrão de token no CountVectorizer, scikit-learn
Então, eu tenho uma lista de palavras-chave da seguinte forma, [u"ALZHEIMER'S DISEASE, OLFACTORY, AGING", u"EEG, COGNITIVE CONTROL, FATIGUE", u"AGING, OBESITY, GENDER", u"AGING, COGNITIVE CONTROL, BRAIN IMAGING"]Então eu quero ...
Python - O que é exatamente sklearn.pipeline.Pipeline?
Não consigo descobrir como osklearn.pipeline.Pipeline funciona exatamente. Existem algumas explicações nodoc [http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html] . Por exemplo, o que eles querem dizer com: Pipeline ...