Resultados da pesquisa a pedido "scikit-learn"
Pesquisa em grade e parada antecipada usando a validação cruzada com o XGBoost no SciKit-Learn
Eu sou bastante novo em aprender sci-kit e tenho tentado ajustar o hiper-paramater XGBoost. Meu objetivo é usar a parada antecipada e a pesquisa em grade para ajustar os parâmetros do modelo e usar a parada antecipada para controlar o número de ...
'Árvore KD' com métrica de distância personalizada
Eu quero usar 'KDtree' (esta é a melhor opção. Outros algoritmos 'KNN' não são ideais para o meu projeto) com métrica de distância personalizada. Eu verifiquei algumas respostas aqui para perguntas semelhantes, e isso deve funcionar ... ...
Scikit Learn OneHotEncoder ajustar e transformar Error: ValueError: X tem formato diferente do que durante o ajuste
Abaixo está o meu código. Eu sei por que o erro está ocorrendo durante a transformação. Isso ocorre devido à incompatibilidade da lista de recursos durante o ajuste e a transformação. Como posso resolver isso? Como posso obter 0 para todos os ...
O sklearn PCA.transform fornece resultados diferentes para diferentes tentativas
Estou fazendo algum PCA usando sklearn.decomposition.PCA. Descobri que, se a matriz de entrada X for grande, os resultados de duas instâncias PCA diferentes para PCA.transform não serão os mesmos. Por exemplo, quando X é uma matriz 100x200, não ...
Obter uma pontuação baixa na ROC AUC, mas uma alta precisão
Usando umLogisticRegression aula emscikit-learn em uma versão doconjunto de dados de atraso de vôo [https://www.kaggle.com/usdot/flight-delays/data]. eu usopandas para selecionar algumas colunas: df = df[["MONTH", "DAY_OF_MONTH", "DAY_OF_WEEK", ...
Sklearn: ROC para classificação multiclasse
Estou fazendo experiências diferentes de classificação de texto. Agora preciso calcular o AUC-ROC para cada tarefa. Para as classificações binárias, eu já fiz funcionar com este código: scaler = StandardScaler(with_mean=False) enc = ...
ValueError: Tipo de etiqueta desconhecido: 'desconhecido'
Eu tento executar o seguinte código. Btw, eu sou novo em python e sklearn. import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression # data import and preparation trainData = pd.read_csv('train.csv') train = ...
Como preencher valores nulos em um conjunto de dados usando python que corresponde a duas outras colunas?
Eu tenho um conjunto de dados titânico. Tem atributos e eu estava trabalhando viril em 1.Age 2.Embark (a partir do qual os passageiros do porto embarcaram .. Existem 3 portos totais .. S, Q e C) 3.Survived (0 para não sobreviveu, 1 ...
Como obter a curva ROC para a árvore de decisão?
Estou tentando encontrarCurva ROC eCurva AUROC para árvore de decisão. Meu código era algo como clf.fit(x,y) y_score = clf.fit(x,y).decision_function(test[col]) pred ...
Como padronizar apenas variáveis numéricas em um pipeline do sklearn?
Estou tentando criar um pipeline do sklearn com 2 etapas: Padronize os dadosAjustar os dados usando KNNNo entanto, meus dados têm variáveis numéricas e categóricas, que converti em manequins usandopd.get_dummies. Quero padronizar as variáveis ...