Resultados da pesquisa a pedido "scikit-learn"
Pandas: use várias colunas de um quadro de dados como índice de outro
Eu tenho um grande dataframe com meus dados e outro da mesma primeira dimensão que contém metadados sobre cada ponto no tempo (por exemplo, qual número de teste era, que tipo de teste era). O que eu quero fazer é cortar o grande quadro de dados ...
Como aplicar LabelEncoder para uma coluna específica no dataframe do Pandas
Eu tenho um conjunto de dados carregado pelo dataframe em que o rótulo da classe precisa ser codificado usandoLabelEncoder do scikit-learn. A colunalabel é a coluna do rótulo da classe que possui as seguintes classes: [‘Standing’, ‘Walking’, ...
Scikit learn - fit_transform no conjunto de testes
Estou lutando para usar a Random Forest em Python com o Scikit learn. Meu problema é que eu o uso para classificação de texto (em 3 classes - positivo / negativo / neutro) e os recursos que extraio são principalmente palavras / unigramas, por ...
Regressão OLS: modelos Scikit vs. Stats?
Versão curta: Eu estava usando o scikit LinearRegression em alguns dados, mas estou acostumado a p-values, então coloque os dados nos modelos estatísticos OLS e, embora o R ^ 2 seja quase o mesmo, os coeficientes variáveis são todos diferentes em ...
sklearn parcial_fit () não mostrando resultados precisos como fit ()
Estou treinando 3 listas de dados L1, L2, L3. Primeiro eu treino todos eles com SGDClassifier fit () e, posteriormente, instância por instância com o parcial_fit (). Eu testo os dados com L4, L5. [Os dados nas listas são dados de imagem e as ...
Extraindo componentes do PCA com o sklearn
estou usandoPCA do sklearn [http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html] para redução de dimensionalidade em um grande conjunto de imagens. Depois que o PCA estiver instalado, eu gostaria de ver como são os ...
Numpy hstack - “ValueError: todas as matrizes de entrada devem ter o mesmo número de dimensões” - mas elas
Estou tentando juntar duas matrizes numpy. Em uma, tenho um conjunto de colunas / recursos após executar o TF-IDF em uma única coluna de texto. No outro, tenho uma coluna / recurso que é um número inteiro. Portanto, leio em uma coluna de dados de ...
Erro de memória ao tentar aplicar 'fit_transform ()' no TFidfVectorizer contendo a coluna Pandas Dataframe (contendo cadeias)
Estou tentando uma operação semelhante, como mostradoaqui [https://stackoverflow.com/questions/39303912/tfidfvectorizer-in-scikit-learn-valueerror-np-nan-is-an-invalid-document] . Começo com a leitura em duas colunas de um arquivo CSV que contém ...
Prevendo quanto tempo uma classificação de aprendizado do scikit levará para ser executada
Existe uma maneira de prever quanto tempo levará para executar um classificador a partir do aprendizado do sci-kit com base nos parâmetros e no conjunto de dados? Eu sei, meta bonita, certo? Algumas combinações de classificadores / parâmetros ...
ImportError: não é possível importar o nome inplace_column_scale
Usando o Python 2.7 com o pacote scikit-learn 0.14. Ele funciona bem em alguns exemplos da guilda de usuários que esperam os modelos lineares. Traceback (most recent call last): File "E:\P\plot_ols.py", line 28, in <module> from sklearn import ...