Resultados da pesquisa a pedido "dataframe"
Extraia a primeira palavra de uma coluna e insira na nova coluna
Eu tenho um dataframe abaixo e quero extrair a primeira palavra e inseri-la em uma nova coluna Dataframe1: COL1 Nick K Jones Dave G Barros Matt H SmithConverta para isso: Dataframe2: COL1 COL2 Nick K Jones Nick Dave G Barros Dave Matt H Smith Matt
Spark: gravando DataFrame como JSON compactado
Apache Spark'sDataFrameReader.json() pode lidar com arquivos JSONlines compactados automaticamente, mas não parece haver uma maneira de obterDataFrameWriter.json() para gravar arquivos JSONlines compactados. A E / S de rede extra é muito cara na ...
Comparar dois DataFrames e mostrar a diferença está gerando um erro
Consigo encontrar a diferença comparando os dois DataFrames e concatenando as diferenças em um novo DataFrame, mas há um problema quando valores estão ausentes em um dos DataFrames, um erro é gerado:ValueError: Can only ...
Python: Crie um array estruturado numpy estruturado a partir de duas colunas em um DataFrame
Como você cria uma matriz estruturada de duas colunas em um DataFrame? Eu tentei isso: df = pd.DataFrame(data=[[1,2],[10,20]], columns=['a','b']) df a b 0 1 2 1 10 20 x = np.array([([val for val in list(df['a'])], [val for val in ...
Anexando valores e resíduos previstos ao dataframe do pandas
É uma prática comum e útil anexar valores e resíduos previstos da execução de uma regressão em um quadro de dados como colunas distintas. Eu sou novo nos pandas e estou tendo problemas para executar esta operação muito simples. Eu sei que estou ...
R- criar nova variável de quadro de dados a partir do subconjunto de duas variáveis com dados ausentes NA
Eu tenho um exemplo simples de quadro de dados com duas colunas de dados (dados1 e dados2) e duas variáveis de agrupamento (Medida 1 e 2). As medidas 1 e 2 têm dados ausentes NA. d <- data.frame(Measure1 = 1:2, Measure2 = 3:4, data1 = 1:10, ...
R converter lista de listas para dataframe
Preciso processar os dados que estão sendo fornecidos em uma pasta de trabalho do Excel (xlsx) protegida por senha. Por razões legais, não posso criar um arquivo do Excel desprotegido ou um arquivo csv etc. e processar a partir daí. Nenhum dos ...
Nos pandas Python, inicie o índice de linha de 1 em vez de zero sem criar coluna adicional
Eu sei que posso redefinir os índices assim df.reset_index(inplace=True)mas isso iniciará o índice a partir de0. Eu quero começar com isso1. Como faço isso sem criar colunas extras e mantendo a funcionalidade e as opções index / reset_index? eu ...
como alterar uma coluna Dataframe do tipo String para Double type no pyspark
Eu tenho um quadro de dados com coluna como String. Eu queria mudar o tipo de coluna para Double type no PySpark. A seguir está o caminho, eu fiz: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf ...
Mesclar dois DataFrames com base em várias chaves nos pandas
Os pandas (ou outro módulo) possuem funções para oferecer suporte à mesclagem (ou associação) de duas tabelas com base em várias chaves? Por exemplo, eu tenho duas tabelas (DataFrames)a eb: >>> a A B value1 1 1 23 1 2 34 2 1 2342 2 2 333 >>> b ...