Resultados da pesquisa a pedido "scikit-learn"

2 a resposta

Diferença entre cross_val_score e cross_val_predict

Eu quero avaliar uma construção de modelo de regressão com o scikitlearn usando validação cruzada e ficando confuso, qual das duas funçõescross_val_score ecross_val_predict Eu deveria usar. Uma opção seria: cvs = DecisionTreeRegressor(max_depth ...

5 a resposta

Como codificar frases quentes no nível do caractere?

Eu gostaria de converter uma frase em uma matriz de vetor quente. Esse vetor seria a representação quente do alfabeto. Seria o seguinte: "hello" # h=7, e=4 l=11 o=14se tornaria [[0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...

2 a resposta

O FeatureUnion personalizado não funcionará?

Estou tentando modificaresta [http://scikit-learn.org/stable/auto_examples/hetero_feature_union.html]exemplo para usar um quadro de dados do Pandas em vez dos conjuntos de dados de teste. Eu não sou capaz de fazê-lo, comoItemSelector parece não ...

1 a resposta

quais coeficientes vão para qual classe na regressão logística multiclasse no scikit aprende?

Estou usando a regressão logística do scikit learn para um problema de várias classes. logit = LogisticRegression(penalty='l1') logit = logit.fit(X, y)Estou interessado em quais recursos estão direcionando essa decisão. logit.coef_O texto acima ...

1 a resposta

O treinamento de modelos sklearn em paralelo com o joblib bloqueia o processo

Como sugerido emesta resposta [https://stackoverflow.com/questions/29589327/train-multiple-models-in-parallel-with-sklearn] , Tentei usar o joblib para treinar vários modelos de aprendizado de scikit em paralelo. import joblib import numpy from ...

2 a resposta

Erro não ajustado ao usar o graphviz do Sklearn

quando estou tentando exportar um gráfico de floresta aleatório usando o seguinte comando: tree.export_graphviz(rnd_clf, out_file = None, feature_names = X_test[::1])Eu recebo o seguinte erro: NotFittedError: This RandomForestClassifier ...

1 a resposta

Prever determinado rótulo com a maior probabilidade possível na regressão logística

Estou construindo o modelo, tendo 12 parâmetros e rótulos {0,1} usando regressão logística no sklearn. Eu preciso estar muito confiante sobre o rótulo 0, estou bem se algum '0' for classificado incorretamente como 1. O objetivo disso é que eu ...

2 a resposta

Colunas pandas específicas como argumentos na nova coluna de saídas df.apply

Dado um DataFrame de pandas como abaixo: import pandas as pd from sklearn.metrics import mean_squared_error df = pd.DataFrame.from_dict( {'row': ['a','b','c','d','e','y'], 'a': [ 0, -.8,-.6,-.3, .8, .01], 'b': [-.8, 0, .5, .7,-.9, .01], 'c': ...

3 a resposta

LabelEncoder: TypeError: '>' não suportado entre instâncias de 'float' e 'str'

Estou enfrentando esse erro para várias variáveis, mesmo tratando valores ausentes. Por exemplo: le = preprocessing.LabelEncoder() categorical = list(df.select_dtypes(include=['object']).columns.values) for cat in categorical: print(cat) ...

2 a resposta

Como destacar os recursos numéricos e de texto da união no python, aprenda corretamente

Estou tentando usar a feature feature pela primeira vez no pipeline do sklearn para combinar recursos numéricos (2 colunas) e de texto (1 coluna) para a classificação de várias classes. from sklearn.preprocessing import FunctionTransformer from ...