Resultados da pesquisa a pedido "scikit-learn"

2 a resposta

Como usar a floresta de isolamento

Estou tentando detectar os valores discrepantes do meu conjunto de dados e encontro os dados do sklearn.Floresta de isolamento [http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.IsolationForest.html] . Não consigo entender como ...

1 a resposta

Pipeline "paralelo" para obter o melhor modelo usando a pesquisa em grade

No sklearn, um pipeline serial pode ser definido para obter a melhor combinação de hiperparâmetros para todas as partes consecutivas do pipeline. Um pipeline serial pode ser implementado da seguinte maneira: from sklearn.svm import SVC from ...

1 a resposta

como funciona a estimativa de densidade de kernel 2d em python (sklearn)?

Sinto muito pela pergunta provavelmente estúpida, mas estou tentando agora, durante horas, estimar uma densidade a partir de um conjunto de dados 2D. Vamos supor que meus dados sejam dados pelo array:sample = np.random.uniform(0,1,size=(50,2)) . ...

0 a resposta

Como a frequência do termo é calculada no TfidfVectorizer?

Eu procurei muito para entender isso, mas não sou capaz. Entendo que, por padrão, o TfidfVectorizer se aplicarál2 normalização no termo ...

6 a resposta

Trocar zeros na matriz numpy

Eu tenho uma matriz numpy assim: array([[2, 1, 23, 32], [34, 3, 3, 0], [3, 33, 0, 0], [32, 0, 0, 0]], dtype=int32)Agora eu quero mudar todos os números para a direita e trocar os zeros para a esquerda da seguinte maneira: array([[2, 1, 23, 32], ...

1 a resposta

Semelhança cosseno

Eu estava lendo e me deparei com esta fórmula: [/imgs/ehC5H.png] A fórmula é para a semelhança de cosseno. Eu pensei que isso parecia interessante e criei uma matriz numpy que tem user_id como linha e item_id como coluna. Por exemplo, deixeM ...

1 a resposta

GridSearchCV - XGBoost - Parada antecipada

Estou tentando fazer uma pesquisa por hiperparâmetro usando o GridSearchCV do scikit-learn no XGBoost. Durante a pesquisa em grade, eu gostaria que parasse cedo, pois reduz drasticamente o tempo de pesquisa e (espera) obter melhores resultados na ...

8 a resposta

Não é possível obter o banco de dados MNIST através do Anaconda / jupyter

Hu pessoal, Eu sou novo em python / anaconda / jupyter / numPy, panda, etc .... então, por favor, desculpe-me se for uma pergunta realmente estúpida. Estou tentando obter o banco de dados MNIST usando anaconda / jupyter. Mas sempre que recebo um ...

1 a resposta

Como atribuir uma nova observação aos clusters Kmeans existentes com base na lógica de centríodo de cluster mais próxima em python?

Usei o código abaixo para criar clusters k-means usando o Scikit learn. kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++') kmean_fit = kmean.fit(clus_data)Eu também salvei ...

1 a resposta

sklearn metrics.log_loss é positivo versus a pontuação 'neg_log_loss' é negativo

Certifique-se de que estou acertando: Se usarmossklearn.metrics.log_loss [http://scikit-learn.org/stable/modules/generated/sklearn.metrics.log_loss.html] autônomo, ou seja, log_loss (y_true, y_pred), gera uma pontuação positiva - quanto menor a ...