Resultados da pesquisa a pedido "scikit-learn"

3 a resposta

sklearn LogisticRegression sem regularização

A classe de regressão logística no sklearn vem com a regularização L1 e L2. Como posso desativar a regularização para obter o ajuste logístico "bruto", como no glmfit no Matlab? Eu acho que posso definir C = número grande, mas não acho que seja ...

1 a resposta

Erro Scipy: tamanho de numpy.dtype alterado, pode indicar incompatibilidade binária (e comportamento estranho associado)

Estou instalando o numpy / scipy / scikit-learn no OS X 10.9.4 e estou recebendo erros sobre "o tamanho do numpy.dtype alterado, pode indicar incompatibilidade binária". Aqui está o que eu fiz para construir o repositório: mkvirtualenv thm ...

1 a resposta

KL-Divergência de dois GMMs

Eu tenho dois GMMs que costumava ajustar dois conjuntos diferentes de dados no mesmo espaço e gostaria de calcular a divergência de KL entre eles. Atualmente, estou usando os GMMs definidos no sklearn ...

1 a resposta

Scikit-learn Ridge Regression com termo de interceptação não regulamentado

A regressão de Ridge do scikit-learn inclui o coeficiente de interceptação no termo de regularização? Em caso afirmativo, existe uma maneira de executar a regressão de cordilheira sem regularizar a interceptação? Suponha que eu ajuste uma ...

1 a resposta

sklearn: Como acelerar um vetorizador (por exemplo, Tfidfvectorizer)

Depois de traçar um perfil completo do meu programa, consegui identificar que ele está sendo retardado pelo vetorizador. Estou trabalhando com dados de texto e duas linhas de vetorização simples de unigrama tfidf estão ocupando 99,2% do tempo ...

3 a resposta

Scikit-learn GridSearch com o erro "ValueError: o formato multiclass não é suportado"

Estou tentando usar o GridSearch para estimativa de parâmetros de LinearSVC () da seguinte maneira - clf_SVM = LinearSVC() params = { 'C': [0.5, 1.0, 1.5], 'tol': [1e-3, 1e-4, 1e-5], 'multi_class': ['ovr', 'crammer_singer'], } gs = ...

1 a resposta

Obter o nome do documento na matriz scikit-learn tf-idf

Eu criei uma matriz tf-idf, mas agora quero recuperar as 2 principais palavras para cada documento. Quero passar a identificação do documento e ele deve me dar as 2 principais palavras. No momento, tenho esses dados de exemplo: from ...

2 a resposta

Qual é um bom intervalo de valores para os hiperparâmetros svm.SVC () a serem explorados via GridSearchCV ()?

Estou com o problema de que os hiperparâmetros do meusvm.SVC() são muito largas para que oGridSearchCV() nunca é concluído! Uma ideia é usarRandomizedSearchCV() em vez de. Mas, novamente, meu conjunto de dados é relativamente grande, de modo que ...

2 a resposta

Como usar os kernels de string no scikit-learn?

Estou tentando gerar um kernel de string que alimenta um classificador de vetor de suporte. Eu tentei com uma função que calcula o kernel, algo assim def stringkernel(K, G): for a in range(len(K)): for b in range(len(G)): R[a][b] = ...

5 a resposta

Regressão linear Scikit-Learn como obter os respectivos recursos do coeficiente?

Estou tentando executar a seleção de recursos avaliando minhas saídas do coeficiente de regressão e selecione os recursos com os maiores coeficientes de magnitude. O problema é que não sei como obter os respectivos recursos, pois apenas os ...