Resultados da pesquisa a pedido "dataframe"

3 a resposta

Extraia a primeira palavra de uma coluna e insira na nova coluna

Eu tenho um dataframe abaixo e quero extrair a primeira palavra e inseri-la em uma nova coluna Dataframe1: COL1 Nick K Jones Dave G Barros Matt H SmithConverta para isso: Dataframe2: COL1 COL2 Nick K Jones Nick Dave G Barros Dave Matt H Smith Matt

3 a resposta

Spark: gravando DataFrame como JSON compactado

Apache Spark'sDataFrameReader.json() pode lidar com arquivos JSONlines compactados automaticamente, mas não parece haver uma maneira de obterDataFrameWriter.json() para gravar arquivos JSONlines compactados. A E / S de rede extra é muito cara na ...

0 a resposta

Comparar dois DataFrames e mostrar a diferença está gerando um erro

Consigo encontrar a diferença comparando os dois DataFrames e concatenando as diferenças em um novo DataFrame, mas há um problema quando valores estão ausentes em um dos DataFrames, um erro é gerado:ValueError: Can only ...

3 a resposta

Python: Crie um array estruturado numpy estruturado a partir de duas colunas em um DataFrame

Como você cria uma matriz estruturada de duas colunas em um DataFrame? Eu tentei isso: df = pd.DataFrame(data=[[1,2],[10,20]], columns=['a','b']) df a b 0 1 2 1 10 20 x = np.array([([val for val in list(df['a'])], [val for val in ...

3 a resposta

Anexando valores e resíduos previstos ao dataframe do pandas

É uma prática comum e útil anexar valores e resíduos previstos da execução de uma regressão em um quadro de dados como colunas distintas. Eu sou novo nos pandas e estou tendo problemas para executar esta operação muito simples. Eu sei que estou ...

2 a resposta

R- criar nova variável de quadro de dados a partir do subconjunto de duas variáveis com dados ausentes NA

Eu tenho um exemplo simples de quadro de dados com duas colunas de dados (dados1 e dados2) e duas variáveis de agrupamento (Medida 1 e 2). As medidas 1 e 2 têm dados ausentes NA. d <- data.frame(Measure1 = 1:2, Measure2 = 3:4, data1 = 1:10, ...

3 a resposta

R converter lista de listas para dataframe

Preciso processar os dados que estão sendo fornecidos em uma pasta de trabalho do Excel (xlsx) protegida por senha. Por razões legais, não posso criar um arquivo do Excel desprotegido ou um arquivo csv etc. e processar a partir daí. Nenhum dos ...

1 a resposta

Nos pandas Python, inicie o índice de linha de 1 em vez de zero sem criar coluna adicional

Eu sei que posso redefinir os índices assim df.reset_index(inplace=True)mas isso iniciará o índice a partir de0. Eu quero começar com isso1. Como faço isso sem criar colunas extras e mantendo a funcionalidade e as opções index / reset_index? eu ...

4 a resposta

como alterar uma coluna Dataframe do tipo String para Double type no pyspark

Eu tenho um quadro de dados com coluna como String. Eu queria mudar o tipo de coluna para Double type no PySpark. A seguir está o caminho, eu fiz: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf ...

1 a resposta

Mesclar dois DataFrames com base em várias chaves nos pandas

Os pandas (ou outro módulo) possuem funções para oferecer suporte à mesclagem (ou associação) de duas tabelas com base em várias chaves? Por exemplo, eu tenho duas tabelas (DataFrames)a eb: >>> a A B value1 1 1 23 1 2 34 2 1 2342 2 2 333 >>> b ...