Resultados da pesquisa a pedido "scikit-learn"

2 a resposta

lista de todos os algoritmos de classificação

Eu tenho um problema de classificação e gostaria de testar todos os algoritmos disponíveis para testar seu desempenho na solução do problema. Se você conhece algum algoritmo de classificação além dos listados abaixo, liste-o ...

1 a resposta

Como executar a codificação Onehot no Sklearn Pipeline

Estou tentando oneHotEncode as variáveis categóricas do meu quadro de dados do Pandas, que inclui variáveis categóricas e contínuas. Sei que isso pode ser feito facilmente com a função pandas .get_dummies (), mas preciso usar um pipeline para ...

2 a resposta

UserWarning: Label not: NUMBER: está presente em todos os exemplos de treinamento

Estou fazendo uma classificação multilabel, onde tento prever os rótulos corretos para cada documento e aqui está o meu código: mlb = MultiLabelBinarizer() X = dataframe['body'].values y = mlb.fit_transform(dataframe['tag'].values) classifier = ...

4 a resposta

Como obter instâncias reproduzíveis, mas distintas, do GroupKFold

NoGroupKFoldfonte, orandom_stateestá configurado paraNone def __init__(self, n_splits=3): super(GroupKFold, self).__init__(n_splits, shuffle=False, random_state=None)Portanto, quando executado várias vezes ...

2 a resposta

Como um recurso de comprimento de variante de codificação quente?

Dada uma lista de recursos de comprimento de variantes: features = [ ['f1', 'f2', 'f3'], ['f2', 'f4', 'f5', 'f6'], ['f1', 'f2'] ]onde cada amostra possui um número variante de recursos e o recursodtype éstr e já um gostoso. Para usar os ...

1 a resposta

Regressão linear multivariada / múltipla no Scikit Learn?

Eu tenho um conjunto de dados (dataTrain.csv & dataTest.csv) no arquivo .csv com este formato: Temperature(K),Pressure(ATM),CompressibilityFactor(Z) 273.1,24.675,0.806677258 313.1,24.675,0.888394713 ...,...,...E capaz de construir um modelo de ...

2 a resposta

O tempo de treinamento do classificador SVM SciKit de uma classe aumenta exponencialmente com o tamanho dos dados de treinamento

Estou usando o classificador Python SciKit OneClass SVM para detectar discrepâncias em linhas de texto. O texto é convertido em recursos numéricos primeiro usando um conjunto de palavras e TF-IDF. Ao treinar (ajustar) o classificador em execução ...

1 a resposta

O Scidit-learn GridSearchCV falha ao ajustar o modelo EM com silhouette_score devido ao encriptado TypeError

O código a seguir resulta em:TypeError: __call__() takes at least 4 arguments (3 given). Instanciei um classificador de cluster e um método de pontuação criado apropriado para cluster. Forneci um conjunto de dados simples para ajuste e ...

1 a resposta

O scikit-learn utiliza a GPU?

Lendo a implementação do scikit-learn no tensroflow: http://learningtensorflow.com/lesson6/ ...

2 a resposta

Python: MemoryError ao calcular a similaridade de cosseno tf-idf entre duas colunas no Pandas

Estou tentando calcular a semelhança de cosseno de vetor tf-idf entre duas colunas em um dataframe do Pandas. Uma coluna contém uma consulta de pesquisa, a outra contém um título de produto. O valor da similaridade do cosseno deve ser um ...