Resultados da pesquisa a pedido "scikit-learn"
Como uso um TimeSeriesSplit com um objeto GridSearchCV para ajustar um modelo no scikit-learn?
Eu procurei nodocumentos do sklearn paraTimeSeriesSplit [http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.TimeSeriesSplit.html] e adocumentos para validação ...
Como mover o modelo de trem para a produção?
Eu finalizei um modelo e ele está executando dentro de limites aceitáveis. Estou usando python e scitkit-learn especificamente. O próximo passo é mover o modelo para produção. Posso solicitar ajuda para mover esses modelos para produção. Como ...
Como criar pipeline para várias colunas do quadro de dados?
Eu tenho o Dataframe que pode ser simplificado para isso: import pandas as pd df = pd.DataFrame([{ 'title': 'batman', 'text': 'man bat man bat', 'url': 'batman.com', 'label':1}, {'title': 'spiderman', 'text': 'spiderman man spider', 'url': ...
Como correlacionar coluna categórica em pandas?
Eu tenho um DataFramedf com uma coluna não numéricaCatColumn. A B CatColumn 0 381.1396 7.343921 Medium 1 481.3268 6.786945 Medium 2 263.3766 7.628746 High 3 177.2400 5.225647 Medium-HighEu quero incluirCatColumn na análise de correlação com ...
Cálculo do ganho de informações com o Scikit-learn
Estou usando o Scikit-learn para classificação de texto. Quero calcular o ganho de informações para cada atributo em relação a uma classe em uma matriz de termo de documento (esparsa). O ganho de informação é definido como H (Classe) - H (Classe ...
Valores negativos da função de decisão
Estou usando o classificador de vetores de suporte do sklearn no conjunto de dados Iris. Quando eu ligodecision_function retorna valores negativos. Mas todas as amostras no conjunto de dados de teste após a classificação têm a classe correta. Eu ...
Como obter previsões com o XGBoost e o XGBoost usando o Scikit-Learn Wrapper para combinar?
Eu sou novo no XGBoost em Python, então peço desculpas se a resposta aqui é óbvia, mas estou tentando pegar um dataframe do panda e fazer com que o XGBoost no Python me dê as mesmas previsões que recebo quando uso o wrapper Scikit-Learn da mesma ...
O indicador de vários rótulos não é suportado para matriz de confusão
multilabel-indicator is not supported é a mensagem de erro que recebo ao tentar executar: confusion_matrix(y_test, predictions) y_test é umDataFrame que é da forma: Horse | Dog | Cat 1 0 0 0 1 0 0 1 0 ... ... ...predictions é umnumpy ...
Etiqueta que codifica várias colunas com a mesma categoria
Considere o seguinte quadro de dados: import pandas as pd from sklearn.preprocessing import LabelEncoder df = pd.DataFrame(data=[["France", "Italy", "Belgium"], ["Italy", "France", "Belgium"]], columns=["a", "b", "c"]) df ...
Como passar com elegância os melhores parâmetros do GridseachCV do Sklearn para outro modelo?
Encontrei um conjunto de melhores hiperparâmetros para o meu estimador KNN com o Grid Search CV: >>> knn_gridsearch_model.best_params_ {'algorithm': 'auto', 'metric': 'manhattan', 'n_neighbors': 3}Por enquanto, tudo bem. Quero treinar ...