Resultados da pesquisa a pedido "scikit-learn"

1 a resposta

Pesquisa em grade e parada antecipada usando a validação cruzada com o XGBoost no SciKit-Learn

Eu sou bastante novo em aprender sci-kit e tenho tentado ajustar o hiper-paramater XGBoost. Meu objetivo é usar a parada antecipada e a pesquisa em grade para ajustar os parâmetros do modelo e usar a parada antecipada para controlar o número de ...

1 a resposta

'Árvore KD' com métrica de distância personalizada

Eu quero usar 'KDtree' (esta é a melhor opção. Outros algoritmos 'KNN' não são ideais para o meu projeto) com métrica de distância personalizada. Eu verifiquei algumas respostas aqui para perguntas semelhantes, e isso deve funcionar ... ...

2 a resposta

Scikit Learn OneHotEncoder ajustar e transformar Error: ValueError: X tem formato diferente do que durante o ajuste

Abaixo está o meu código. Eu sei por que o erro está ocorrendo durante a transformação. Isso ocorre devido à incompatibilidade da lista de recursos durante o ajuste e a transformação. Como posso resolver isso? Como posso obter 0 para todos os ...

1 a resposta

O sklearn PCA.transform fornece resultados diferentes para diferentes tentativas

Estou fazendo algum PCA usando sklearn.decomposition.PCA. Descobri que, se a matriz de entrada X for grande, os resultados de duas instâncias PCA diferentes para PCA.transform não serão os mesmos. Por exemplo, quando X é uma matriz 100x200, não ...

2 a resposta

Obter uma pontuação baixa na ROC AUC, mas uma alta precisão

Usando umLogisticRegression aula emscikit-learn em uma versão doconjunto de dados de atraso de vôo [https://www.kaggle.com/usdot/flight-delays/data]. eu usopandas para selecionar algumas colunas: df = df[["MONTH", "DAY_OF_MONTH", "DAY_OF_WEEK", ...

1 a resposta

Sklearn: ROC para classificação multiclasse

Estou fazendo experiências diferentes de classificação de texto. Agora preciso calcular o AUC-ROC para cada tarefa. Para as classificações binárias, eu já fiz funcionar com este código: scaler = StandardScaler(with_mean=False) enc = ...

1 a resposta

ValueError: Tipo de etiqueta desconhecido: 'desconhecido'

Eu tento executar o seguinte código. Btw, eu sou novo em python e sklearn. import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression # data import and preparation trainData = pd.read_csv('train.csv') train = ...

1 a resposta

Como preencher valores nulos em um conjunto de dados usando python que corresponde a duas outras colunas?

Eu tenho um conjunto de dados titânico. Tem atributos e eu estava trabalhando viril em 1.Age 2.Embark (a partir do qual os passageiros do porto embarcaram .. Existem 3 portos totais .. S, Q e C) 3.Survived (0 para não sobreviveu, 1 ...

2 a resposta

Como obter a curva ROC para a árvore de decisão?

Estou tentando encontrarCurva ROC eCurva AUROC para árvore de decisão. Meu código era algo como clf.fit(x,y) y_score = clf.fit(x,y).decision_function(test[col]) pred ...

3 a resposta

Como padronizar apenas variáveis numéricas em um pipeline do sklearn?

Estou tentando criar um pipeline do sklearn com 2 etapas: Padronize os dadosAjustar os dados usando KNNNo entanto, meus dados têm variáveis numéricas e categóricas, que converti em manequins usandopd.get_dummies. Quero padronizar as variáveis ...