Resultados da pesquisa a pedido "dataframe"
Como descartar duplicatas e manter o primeiro valor em pandas?
Quero eliminar duplicatas e manter o primeiro valor. As duplicatas que desejam ser descartadas são A = 'df'. Aqui estão meus dados A B C D E qw 1 3 1 1 er 2 4 2 6 ew 4 8 44 4 df 34 34 34 34 df 2 5 2 2 df 3 3 7 3 df 4 4 7 4 we 2 5 5 2 we 4 4 4 4 ...
Comparando valores da coluna do quadro de dados do Pandas usando valores de deslocamento de outra coluna
Eu tenho um quadro de dados como: Time InvInstance 5 5 8 4 9 3 19 2 20 1 3 3 8 2 13 1Time variável é classificada eInvInstance A variável indica o número de linhas até o final de umTime quadra. Quero criar outra coluna mostrando se uma condição ...
Eixo independente para cada subparcela no boxplot de pandas
O código abaixo ajuda na obtenção de subparcelas com caixas coloridas exclusivas. Mas todas as subparcelas compartilham um conjunto comum de eixos xe y. Eu estava ansioso para ter um eixo independente para cada sub-plot: import pandas as pd ...
Por que o pushdown de predicado não é usado na API do conjunto de dados digitada (versus API do DataFrame não digitada)?
Eu sempre pensei que as APIs do conjunto de dados / dataframe são as mesmas ... e a única diferença é que a API do conjunto de dados fornecerá segurança no tempo de compilação. Direito ? Então .. eu tenho um caso muito simples: case class ...
Como adiciono uma linha a um quadro de dados com totais?
Eu tenho um quadro de dados em que gostaria de adicionar uma linha adicional que totalize os valores para as colunas. Por exemplo, digamos que eu tenho esses dados: x <- data.frame(Language=c("C++", "Java", "Python"), Files=c(4009, 210, ...
Manipulação de linha para Dataframe no spark [duplicado]
Esta pergunta já tem uma resposta aqui: Como mapear um Dataframe aninhado no Spark [/questions/36784735/how-to-flatmap-a-nested-dataframe-in-spark] 1 respostaEu tenho um dataframe no spark que é como: column_A | column_B --------- -------- 1 ...
Substituir coluna no quadro de dados da pesquisa de outro quadro de dados
Olá, tenho dois quadros de dados, um contendo: - <p>Country Code | Population </p>e outro contendo: - <p>Country Code | Country Name. </p>Quero fazer uma substituição no primeiro quadro de dados para que CountryCode = CountryName, quando ...
AssertionError: Lacunas no bl_ ref_locs quando desempilhar () o dataframe
Estou tentando desempilhar () os dados em um quadro de dados do Pandas, mas continuo recebendo esse erro e não sei por que. Aqui está o meu código até agora com uma amostra dos meus dados. Minha tentativa de corrigi-lo foi remover todas as linhas ...
como anexar dois ou mais quadros de dados em pandas e fazer algumas análises
Eu tenho 3 df's: df1=pd.DataFrame({"Name":["one","two","three"],"value":[4,5,6]}) df2=pd.DataFrame({"Name":["four","one","three"],"value":[8,6,2]}) df3=pd.DataFrame({"Name":["one","four","six"],"value":[1,1,1]})Posso anexar um por um, mas desejo ...
Mesclar dois quadros de dados, mantendo a ordem da linha original
Quero mesclar dois quadros de dados, mantendo a ordem das linhas originais de um deles (df.2 no exemplo abaixo). Aqui estão alguns dados de amostra (todos os valores declass coluna são definidas nos dois quadros de dados): df.1 <- ...