Resultados da pesquisa a pedido "scikit-learn"
sklearn LogisticRegression sem regularização
A classe de regressão logística no sklearn vem com a regularização L1 e L2. Como posso desativar a regularização para obter o ajuste logístico "bruto", como no glmfit no Matlab? Eu acho que posso definir C = número grande, mas não acho que seja ...
Erro Scipy: tamanho de numpy.dtype alterado, pode indicar incompatibilidade binária (e comportamento estranho associado)
Estou instalando o numpy / scipy / scikit-learn no OS X 10.9.4 e estou recebendo erros sobre "o tamanho do numpy.dtype alterado, pode indicar incompatibilidade binária". Aqui está o que eu fiz para construir o repositório: mkvirtualenv thm ...
KL-Divergência de dois GMMs
Eu tenho dois GMMs que costumava ajustar dois conjuntos diferentes de dados no mesmo espaço e gostaria de calcular a divergência de KL entre eles. Atualmente, estou usando os GMMs definidos no sklearn ...
Scikit-learn Ridge Regression com termo de interceptação não regulamentado
A regressão de Ridge do scikit-learn inclui o coeficiente de interceptação no termo de regularização? Em caso afirmativo, existe uma maneira de executar a regressão de cordilheira sem regularizar a interceptação? Suponha que eu ajuste uma ...
sklearn: Como acelerar um vetorizador (por exemplo, Tfidfvectorizer)
Depois de traçar um perfil completo do meu programa, consegui identificar que ele está sendo retardado pelo vetorizador. Estou trabalhando com dados de texto e duas linhas de vetorização simples de unigrama tfidf estão ocupando 99,2% do tempo ...
Scikit-learn GridSearch com o erro "ValueError: o formato multiclass não é suportado"
Estou tentando usar o GridSearch para estimativa de parâmetros de LinearSVC () da seguinte maneira - clf_SVM = LinearSVC() params = { 'C': [0.5, 1.0, 1.5], 'tol': [1e-3, 1e-4, 1e-5], 'multi_class': ['ovr', 'crammer_singer'], } gs = ...
Obter o nome do documento na matriz scikit-learn tf-idf
Eu criei uma matriz tf-idf, mas agora quero recuperar as 2 principais palavras para cada documento. Quero passar a identificação do documento e ele deve me dar as 2 principais palavras. No momento, tenho esses dados de exemplo: from ...
Qual é um bom intervalo de valores para os hiperparâmetros svm.SVC () a serem explorados via GridSearchCV ()?
Estou com o problema de que os hiperparâmetros do meusvm.SVC() são muito largas para que oGridSearchCV() nunca é concluído! Uma ideia é usarRandomizedSearchCV() em vez de. Mas, novamente, meu conjunto de dados é relativamente grande, de modo que ...
Como usar os kernels de string no scikit-learn?
Estou tentando gerar um kernel de string que alimenta um classificador de vetor de suporte. Eu tentei com uma função que calcula o kernel, algo assim def stringkernel(K, G): for a in range(len(K)): for b in range(len(G)): R[a][b] = ...
Regressão linear Scikit-Learn como obter os respectivos recursos do coeficiente?
Estou tentando executar a seleção de recursos avaliando minhas saídas do coeficiente de regressão e selecione os recursos com os maiores coeficientes de magnitude. O problema é que não sei como obter os respectivos recursos, pois apenas os ...