Resultados da pesquisa a pedido "dataframe"
R criando uma tabela de sequência a partir de duas colunas
Eu tenho uma tabela como abaixo product=c("a","b","c") min=c(1,5,3) max=c(1,7,7) dd=data.frame(product,min,max) > dd product min max 1 a 1 1 2 b 5 7 3 c 3 7Eu quero criar uma tabela que será parecida abaixo. Quero criar uma linha para cada valor ...
subtrair valor da linha anterior por grupo
Em R, digamos que eu tenho esse quadro de dados: Data id date value 2380 10/30/12 21.01 2380 10/31/12 22.04 2380 11/1/12 22.65 2380 11/2/12 23.11 20100 10/30/12 35.21 20100 10/31/12 37.07 20100 11/1/12 38.17 20100 11/2/12 38.97 20103 10/30/12 ...
Pandas comparar próxima linha
Eu tenho um quadro de dados como este d={} d['z']=['Q8','Q8','Q7','Q9','Q9'] d['t']=['10:30','10:31','10:38','10:40','10:41'] d['qty']=[20,20,9,12,12]Quero comparar a primeira linha com a segunda linha é qty igual à próxima linha ANDé t maior ...
Apache Spark, adicione uma coluna calculada “CASE WHEN… ELSE…” a um DataFrame existente
Estou tentando adicionar uma coluna calculada "CASE WHEN ... ELSE ..." a um DataFrame existente, usando APIs Scala. Iniciando o dataframe: color Red Green BlueQuadro de dados desejado (sintaxe SQL: CASE WHEN color == Verde THEN 1 ELSE 0 END AS ...
ValueError: não é possível reindexar a partir de um eixo duplicado usando isin com pandas
Estou tentando abreviar códigos postais em vários arquivos, mas continuo recebendo ValueError: não é possível reindexar a partir de um eixo duplicado Eu li outra documentação no Stackoverflow, mas não estava prestes a descobrir por que seu eixo ...
DataFrames do Spark: registerTempTable vs not
Eu comecei ontem com o DataFrame ontem e estou gostando muito até agora. Eu não entendo uma coisa, porém ... (referindo-se ao exemplo em "Especificando programaticamente o esquema" ...
Cole os elementos de duas colunas [duplicado]
Esta pergunta já tem uma resposta aqui: Maneira rápida / elegante de unir muitos pares de colunas [/questions/28686848/speedy-elegant-way-to-unite-many-pairs-of-columns] 3 respostasEu tenho um data.frame do seguinte tipo set.seed(12) d = ...
Como definir o particionamento do DataFrame?
Comecei a usar Spark SQL e DataFrames no Spark 1.4.0. Estou querendo definir um particionador personalizado no DataFrames, no Scala, mas não vendo como fazer isso. Uma das tabelas de dados com as quais estou trabalhando contém uma lista ...
Requisitos para converter o quadro de dados Spark em quadro de dados Pandas / R
Estou executando o Spark no fio do Hadoop. Como essa conversão funciona? Um collect () ocorre antes da conversão? Também preciso instalar o Python e o R em todos os nós escravos para que a conversão funcione? Estou lutando para encontrar ...
Criando uma instrução IF em Python que analisa a saída anterior da instrução IF
Estou com dificuldades para criar uma instrução SE que faça o seguinte: Se C1 = Comprar, então ComprarSe C2 = Vender, então VenderSe C1 e C2 = nan, a célula atual = célula anteriorPor favor, veja um exemplo abaixo. Espero criar uma coluna como ...