Resultados da pesquisa a pedido "scikit-learn"
Métrica de distância de pares mais rápida em python
Eu tenho uma matriz 1D de números e quero calcular todas as distâncias euclidianas pareadas. Eu tenho um método (graças a SO) de fazer isso com a transmissão...
kNN com grandes matrizes esparsas em Python
Eu tenho duas grandes matrizes esparsas:
Como propagar o gerador de números aleatórios para o scikit-learn?
Estou tentando escrever um teste de unidade para alguns dos meus códigos que usam o scikit-learn. No entanto, meus testes de unidade parecem não determinísticos. AFAIK, os únicos lugares no meu código em que o scikit-learn usa ...
Recuperar lista de nomes de recursos de treinamento do classificador
Existe uma maneira de recuperar a lista de nomes de recursos usados para o treinamento de um classificador, depois que ele foi treinado com ofit método? Gostaria de obter essas informações antes de aplicar a dados invisíveis. Os dados usados para ...
Confusão de parâmetros do Sklearn Kmeans?
Para que eu possa corrersklearn kmeans como o seguinte: kmeans = KMeans(n_clusters=3,init='random',n_init=10,max_iter=500)Mas estou um pouco confuso sobre o que os parâmetros ...
Manipulação de valores desconhecidos para codificação de etiquetas
Como lidar com valores desconhecidos para codificação de etiquetas no sk-learn? O codificador de etiquetas explodirá apenas com a exceção de que novas etiquetas foram detectadas. O que eu quero é ocodificação de variáveis categóricasatravés ...
Erro ao tentar instalar o sklearn a partir do Pycharm | arrayobject.h não pode ser absoluto
Declaração de erro completa: ValueError: o caminho '/home/andy/anaconda3/lib/python3.5/sitepackages/numpy/core/include/numpy/arrayobject.h' não pode ser absoluto Instalei a versão Scipy e numpy (mkl) baixando os arquivos de roda ...
Ajuda do modelo usando o Scikit-learn ao usar o GridSearch
Como parte do projeto da Enron, construiu o modelo em anexo. Abaixo está o resumo das etapas, O modelo abaixo fornece pontuações altamente perfeitascv = StratifiedShuffleSplit(n_splits = 100, test_size = 0.2, random_state = 42) gcv ...