Resultados da pesquisa a pedido "dataframe"

1 a resposta

Mesclar DataFrames com base em colunas de índice [duplicado]

Esta pergunta já tem uma resposta aqui: Pandas mesclando 101 [/questions/53645882/pandas-merging-101] 1 respostaPercebo que o que estou tentando fazer é possível viaconcat: Mesclar quadros de dados no índice ...

1 a resposta

dplyr pipe: como adicionar uma linha de margem calculando um total (como a função addmargins - base) [duplicado]

Esta pergunta já tem uma resposta aqui: Adicionar totais de linhas de margem na cadeia dplyr [/questions/39507019/add-margin-row-totals-in,-dplyr-chain] 3 respostasMeus dados: data <- data.frame(column1 = c("A","B","C","D"), column2 = c(4, NA, ...

1 a resposta

Como filtrar com base no valor do array no PySpark?

Meu esquema: |-- Canonical_URL: string (nullable = true) |-- Certifications: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- Certification_Authority: string (nullable = true) | | |-- End: string (nullable = true) | | ...

1 a resposta

R Gere pares não repetidos no dataframe

Portanto, o objetivo é comparar cada ID com o outro identificando distâncias. Considere o seguinte quadro de dadosDf ID AN AW a white green b black yellow c purple gray d white grayPara comparar, preciso de uma combinação semelhante à ...

2 a resposta

Substituindo valores em um índice múltiplo de pandas

Eu tenho um quadro de dados com um índice múltiplo. Quero alterar o valor do 2º índice quando certas condições no primeiro índice forem atendidas. Encontrei uma pergunta semelhante (mas diferente) aqui:Substituir um valor no ...

3 a resposta

Como usar a função de divisão em todas as linhas de um quadro de dados em Python?

Quero contar o número de vezes que uma palavra está sendo repetida na sequência de revisão Estou lendo o arquivo csv e armazenando-o em um dataframe python usando a linha abaixo reviews = pd.read_csv("amazon_baby.csv")O código nas linhas abaixo ...

1 a resposta

Erro: o valor verdadeiro de uma série é ambíguo. Python e pandas

Estou tentando identificar todos os contratos de opções para MSFT e GOOG que têm mais de 10.000 em volume para o dia e imprimir o nome do símbolo. Estou recebendo o erro "O valor verdadeiro de uma série é ambíguo. .empty, a.bool (), a.item (), ...

3 a resposta

Como descobrir quais colunas contêm qualquer valor NaN no quadro de dados do Pandas (python)

Dado um dataframe de pandas contendo (talvez) valores de NaN espalhados aqui e ali: Pergunta, questão:como determinar quais colunas contêm valores de NaN? Em particular, posso obter uma lista dos nomes de colunas que contêm NaNs? Obrigado

4 a resposta

Filtrando linhas com base nos valores das colunas no spark dataframe scala

Eu tenho um quadro de dados (spark): id value 3 0 3 1 3 0 4 1 4 0 4 0Eu quero criar um novo quadro de dados: 3 0 3 1 4 1É necessário remover todas as linhas após 1 (valor) para cada id. Tentei com as funções de janela no spark dateframe ...

2 a resposta

Python: como adicionar uma coluna a um dataframe do pandas entre duas colunas?

Eu gostaria de adicionar uma coluna a um quadro de dados entre duas colunas no número rotulado como dataframe. No seguinte quadro de dados, a primeira coluna corresponde ao índice, enquanto a primeira linha ao nome das colunas. df 0 0 1 2 3 4 5 ...