Resultados da pesquisa a pedido "scikit-learn"

2 a resposta

Pandas: use várias colunas de um quadro de dados como índice de outro

Eu tenho um grande dataframe com meus dados e outro da mesma primeira dimensão que contém metadados sobre cada ponto no tempo (por exemplo, qual número de teste era, que tipo de teste era). O que eu quero fazer é cortar o grande quadro de dados ...

1 a resposta

Como aplicar LabelEncoder para uma coluna específica no dataframe do Pandas

Eu tenho um conjunto de dados carregado pelo dataframe em que o rótulo da classe precisa ser codificado usandoLabelEncoder do scikit-learn. A colunalabel é a coluna do rótulo da classe que possui as seguintes classes: [‘Standing’, ‘Walking’, ...

1 a resposta

Scikit learn - fit_transform no conjunto de testes

Estou lutando para usar a Random Forest em Python com o Scikit learn. Meu problema é que eu o uso para classificação de texto (em 3 classes - positivo / negativo / neutro) e os recursos que extraio são principalmente palavras / unigramas, por ...

2 a resposta

Regressão OLS: modelos Scikit vs. Stats?

Versão curta: Eu estava usando o scikit LinearRegression em alguns dados, mas estou acostumado a p-values, então coloque os dados nos modelos estatísticos OLS e, embora o R ^ 2 seja quase o mesmo, os coeficientes variáveis são todos diferentes em ...

1 a resposta

sklearn parcial_fit () não mostrando resultados precisos como fit ()

Estou treinando 3 listas de dados L1, L2, L3. Primeiro eu treino todos eles com SGDClassifier fit () e, posteriormente, instância por instância com o parcial_fit (). Eu testo os dados com L4, L5. [Os dados nas listas são dados de imagem e as ...

2 a resposta

Extraindo componentes do PCA com o sklearn

estou usandoPCA do sklearn [http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html] para redução de dimensionalidade em um grande conjunto de imagens. Depois que o PCA estiver instalado, eu gostaria de ver como são os ...

3 a resposta

Numpy hstack - “ValueError: todas as matrizes de entrada devem ter o mesmo número de dimensões” - mas elas

Estou tentando juntar duas matrizes numpy. Em uma, tenho um conjunto de colunas / recursos após executar o TF-IDF em uma única coluna de texto. No outro, tenho uma coluna / recurso que é um número inteiro. Portanto, leio em uma coluna de dados de ...

1 a resposta

Erro de memória ao tentar aplicar 'fit_transform ()' no TFidfVectorizer contendo a coluna Pandas Dataframe (contendo cadeias)

Estou tentando uma operação semelhante, como mostradoaqui [https://stackoverflow.com/questions/39303912/tfidfvectorizer-in-scikit-learn-valueerror-np-nan-is-an-invalid-document] . Começo com a leitura em duas colunas de um arquivo CSV que contém ...

3 a resposta

Prevendo quanto tempo uma classificação de aprendizado do scikit levará para ser executada

Existe uma maneira de prever quanto tempo levará para executar um classificador a partir do aprendizado do sci-kit com base nos parâmetros e no conjunto de dados? Eu sei, meta bonita, certo? Algumas combinações de classificadores / parâmetros ...

7 a resposta

ImportError: não é possível importar o nome inplace_column_scale

Usando o Python 2.7 com o pacote scikit-learn 0.14. Ele funciona bem em alguns exemplos da guilda de usuários que esperam os modelos lineares. Traceback (most recent call last): File "E:\P\plot_ols.py", line 28, in <module> from sklearn import ...