Resultados da pesquisa a pedido "dataframe"
Concatene linhas de pandas DataFrame com o mesmo ID
Digamos que eu tenha um DataFrame de pandas, como: A B id 0 1 1 0 1 2 1 0 2 3 2 1 3 0 2 1Digamos que eu queira combinar linhas com o mesmo ID para que os outros elementos nas linhas sejam reunidos em uma lista, para que o quadro de dados acima ...
em R, como somar fluindo linha em um quadro de dados
Eu tenho df (A) (ncol = 1, nrow = 1356) col1 5 7 9 3 2 3.8 24 2.7 12 11 23 .... to 1356 row...gostaria da soma da primeira linha à quinta linha e depois da segunda linha à sétima linha e assim por diante. Além disso, cada valor é multiplicado ...
Remova colunas do quadro de dados com base nas condições em R
Eu tenho que remover colunas no meu dataframe que tem mais de 4000 colunas e 180 linhas. As condições que eu quero definir para remover a coluna no dataframe são: (i) Remova a coluna se houver menos de dois valores / entradas nesse coluna (ii) ...
Função Strip ou Regex no Spark 1.3 Dataframe
Eu tenho algum código do PySpark 1.5 que infelizmente tenho que portar para o Spark 1.3. Eu tenho uma coluna com elementos que são alfanuméricos, mas quero apenas os dígitos. Um exemplo dos elementos em 'old_col' de 'df' são: '125 Bytes'No Spark ...
Grupo DataFrame do Pandas por intervalos sobrepostos de comprimento variável
Estou tentando agrupar um DataFrame por 2 colunas (veja o exemplo abaixo). Para a primeira coluna, quero que cada valor pertença a um grupo. Para a segunda coluna, quero agrupar intervalos sobrepostos de tamanho desigual. Meu entendimento é que ...
linhas data.frame para uma lista
Eu tenho um data.frame que gostaria de converter em uma lista por linhas, o que significa que cada linha corresponderia aos seus próprios elementos de lista. Em outras palavras, eu gostaria de uma lista que contenha o data.frame com linhas. Até ...
Como criar um loop for em R para este cálculo peculiar
Não consigo descobrir com isso (aparentemente) simplesmente o tipo de operação: Dados esses dois quadros de dados diferentesdf(A) (nrow = 10, ncol = 3) edf(B) (nrow = 3, ncol = 3) df(A) df(B) col1 col2 col3 col1 col2 col3 1 2 4 1 4 5 3 5 7 2 7 ...
Várias operações agregadas na mesma coluna de um dataframe spark
Eu tenho três matrizes do tipo string que contêm as seguintes informações: groupBy array: contendo os nomes das colunas pelas quais quero agrupar meus dados.matriz agregada: contendo nomes de colunas que eu quero agregar.matriz de operações: ...
Manipule um quadro de dados em que haja várias colunas para cada experiência
Eu tenho muitos experimentos de seqüenciamento, cada um com vários resultados para cada uma das centenas de genes. Quando os dados são gerados em outro programa, eles não estão em um formato útil para mim, pois todos os experimentos e cada ...
Como calcular a variação percentual em comparação com o valor inicial usando pandas?
eu tenho umDataFrame e precisa calcular a variação percentual em comparação com o início do ano pelas empresas. Existe alguma maneira de usarpct_change() ou outro método para executar esta tarefa? Obrigado! df parece security date price IBM ...