Resultados da pesquisa a pedido "dataframe"
Concatenar índice e sequência de caracteres para nova coluna
Eu tenho um quadro de dados de 3 colunas (incluindo índice): name age 0 satya 24 1 abc 26 2 xyz 29 3 def 32então precisa adicionar uma nova colunadetail que armazenará o nome do arquivo de detalhes e o valor nessa coluna deve ser ...
Otimize a divisão da coluna de listas em colunas separadas
Eu estive procurando dividir uma coluna composta de listas em colunas separadas. Eu tenho uma solução, mas é muito lenta. Eu tenho o seguinte panda dataframe |basket | |['two apple','A banana'] | |['Red pear','A banana'] | |['two apple','A ...
Spark adiciona nova coluna ao quadro de dados com valor da linha anterior
Gostaria de saber como posso obter o seguinte no Spark (Pyspark) Dataframe inicial: +--+---+ |id|num| +--+---+ |4 |9.0| +--+---+ |3 |7.0| +--+---+ |2 |3.0| +--+---+ |1 |5.0| +--+---+Dataframe resultante: +--+---+-------+ |id|num|new_Col| ...
read_csv com cabeçalho ausente / incompleto ou número irregular de colunas
eu tenho umfile.csv com ~ 15k linhas que se parece com isso SAMPLE_TIME, POS, OFF, HISTOGRAM 2015-07-15 16:41:56, 0-0-0-0-3, 1, 2,0,5,59,0,0,0,0,0,2,0,0,0,0,0,0,0,0,0, 2015-07-15 16:42:55, 0-0-0-0-3, 1, 0,0,5,9,0,0,0,0,0,2,0,0,0,50,0, 2015-07-15 ...
Adicionando uma coluna específica de um dataframe do Pandas para outro dataframe do Pandas
Estou tentando adicionar uma coluna a um dataframe do pandas (df1) que possui uma coluna identificador exclusivo ('id') de outro dataframe (df2) que possui o mesmo identificador exclusivo ('sameid'). Eu tentei mesclar, mas preciso adicionar ...
Mesclar quadros de dados de tamanhos diferentes
Eu tenho dois quadros de dadosd1 ed2 respectivamente como: x y z 10 10 7 10 12 6 11 10 8 11 12 2 12 10 1 12 12 5 x y z 10 10 100 11 10 200 12 12 400Eu quero algo como: x y z 10 10 100 10 12 6 11 10 200 11 12 2 12 10 1 12 12 400Lamento muito ...
O DataFrame do Pandas verifica se o valor da coluna existe em um grupo de colunas
Eu tenho um DataFrame como este (exemplo simplificado) id v0 v1 v2 v3 v4 1 10 5 10 22 50 2 22 23 55 60 50 3 8 2 40 80 110 4 15 15 25 100 101E gostaria de criar uma coluna adicional que seja 1 ou 0. 1 se o valor de v0 estiver nos valores de v1 a ...
Subcondicionando um quadro de dados com base no conteúdo de outro quadro de dados
Eu tenho dois data.frames. Por exemplo, digamos que eles se parecem com isso: df1 <- data.frame(x=rep(letters[1:26], 16)) df2 <- data.frame(y=letters[1:4])O que eu gostaria de fazer é o subconjunto 'df1' para conter as linhas cujo primeiro valor ...
Como converter uma coluna WrappedArray no spark dataframe para Strings?
Estou tentando converter uma coluna que contém Array [String] para String, mas sempre recebo esse erro org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 78.0 failed 4 times, most recent failure: Lost task 0.3 in ...
Como ampliar um quadro de dados - pandas
Basicamente, eu quero apenas achatar (talvez não seja um bom termo) por exemplo, com dataframe: A B C 0 1 [1,2] [1, 10] 1 2 [2, 14] [2, 18]Eu quero obter a saída de: A B1 B2 B3 B4 0 1 1 2 1 10 1 2 2 14 2 18Eu ...