Resultados da pesquisa a pedido "sklearn-pandas"
Como normalizar os dados de treinamento e teste usando o MinMaxScaler sklearn
Então, eu tenho essa dúvida e tenho procurado respostas. Então a questão é quando eu uso, from sklearn import preprocessing min_max_scaler = preprocessing.MinMaxScaler() df ...
Como executar o OneHotEncoding no Sklearn, obtendo erro de valor
Comecei a aprender aprendizado de máquina. Ao praticar uma das tarefas, estou recebendo erro de valor, mas segui os mesmos passos que o instrutor. Estou recebendo erro de valor, por favor ajude. dff Country Name 0 AUS Sri 1 USA Vignesh 2 IND ...
Convertendo uma coluna do Pandas Dataframe em um hot label
Eu tenho um dataframe de pandas semelhante a este: Col1 ABC 0 XYZ A 1 XYZ B 2 XYZ CUsando os pandasget_dummies() função na coluna ABC, eu posso obter isso: Col1 A B C 0 XYZ 1 0 0 1 XYZ 0 1 0 2 XYZ 0 0 1Enquanto eu preciso de algo assim, onde a ...
Anexar tfidf ao dataframe do pandas
Eu tenho a seguinte estrutura de pandas: col1 col2 col3 text 1 1 0 meaningful text 5 9 7 trees 7 8 2 textEu gostaria de vetorizá-lo usando um vetorizador tfidf. Isso, no entanto, retorna uma matriz de análise, que eu posso realmente transformar ...
Erro de valor de regressão linear do Python Sklearn
Eu tenho experimentado a regressão linear usando o sklearn. Às vezes, recebo um erro de valor, às vezes funciona bem. Não tenho certeza de qual abordagem usar. A mensagem de erro é a seguinte: Traceback (most recent call last): File "<stdin>", ...
Carregando o modelo sklearn em Java. Modelo criado com DNNClassifier em python
O objetivo é abrir em Java um modelo criado / treinado em python comtensorflow.contrib.learn.learn.DNNClassifier. No momento, a questão principal é saber o nome do "tensor" para fornecer java no método do corredor de sessão. Eu tenho esse ...
Matriz de co-ocorrência da lista de palavras em Python
Eu tenho uma lista de nomes como: names = ['A', 'B', 'C', 'D']e uma lista de documentos, que em cada documento são mencionados alguns desses nomes. document =[['A', 'B'], ['C', 'B', 'K'],['A', 'B', 'C', 'D', 'Z']]Gostaria de obter uma saída ...
Como executar a codificação Onehot no Sklearn Pipeline
Estou tentando oneHotEncode as variáveis categóricas do meu quadro de dados do Pandas, que inclui variáveis categóricas e contínuas. Sei que isso pode ser feito facilmente com a função pandas .get_dummies (), mas preciso usar um pipeline para ...
Regressão linear multivariada / múltipla no Scikit Learn?
Eu tenho um conjunto de dados (dataTrain.csv & dataTest.csv) no arquivo .csv com este formato: Temperature(K),Pressure(ATM),CompressibilityFactor(Z) 273.1,24.675,0.806677258 313.1,24.675,0.888394713 ...,...,...E capaz de construir um modelo de ...
sklearn amostragem estratificada com base em uma coluna
Eu tenho um arquivo CSV razoavelmente grande contendo dados de revisão da amazon que li em um quadro de dados do pandas. Quero dividir os dados 80-20 (teste de trem), mas, ao fazê-lo, quero garantir que os dados divididos estejam representando ...
Página 1 do 2