Como você combina duas colunas em uma nova coluna em um dataframe feito de dois ou mais arquivos csv diferentes?
Eu tenho vários arquivos csv todos nomeados com datas e para todos eles eu quero criar uma nova coluna em cada arquivo que contém dados de duas outras colunas colocadas juntas. Então, quero combiná-los em um grande dataframe e escolher apenas duas dessas colunas para manter. Aqui está um exemplo:
Digamos que eu tenha dois quadros de dados:
a b c a b c
x 1 2 3 x 3 2 1
y 2 3 1 y 2 1 3
Então eu quero criar uma nova coluna d em cada um deles:
a b c d a b c d
x 1 2 3 13 x 3 2 1 31
y 2 3 1 21 y 2 1 3 23
Então eu quero combiná-los assim:
a b c d
x 1 2 3 13
y 2 3 1 21
x 3 2 1 31
y 2 1 3 23
Então mantenha duas das colunas a e d e apague as outras duas colunas b e c:
a d
x 1 13
y 2 21
x 3 31
y 2 23
Aqui está o meu código atual (ele não funciona quando tento combinar duas das colunas ou quando tento manter apenas duas das colunas):
f <- list.files(pattern="201\\d{5}\\.csv") # reading in all the files
mydata <- sapply(f, read.csv, simplify=FALSE) # assigning them to a dataframe
do.call(rbind,mydata) # combining all of those dataframes into one
mydata$Data <- paste(mydata$LAST_UPDATE_DT,mydata$px_last) # combining two of the columns into a new column named "Data"
c('X','Data') %in% names(mydata) # keeping two of the columns while deleting the rest