Aplicando uma função para cada linha de um data.table
Eu estou procurando uma maneira de aplicar eficientemente uma função para cada linha de data.table. Vamos considerar a seguinte tabela de dados:
library(data.table)
library(stringr)
x <- data.table(a = c(1:3, 1), b = c('12 13', '14 15', '16 17', '18 19'))
> x
a b
1: 1 12 13
2: 2 14 15
3: 3 16 17
4: 1 18 19
Digamos que eu queira dividir cada elemento da colunab
por espaço (rendendo assim duas linhas para cada linha nos dados originais) e unindo as tabelas de dados resultantes. Para o exemplo acima, preciso do seguinte resultado:
a V1
1: 1 12
2: 1 13
3: 2 14
4: 2 15
5: 3 16
6: 3 17
7: 1 18
8: 1 19
O seguinte iria funcionarse colunaa
tem apenas valores únicos:
x[, list(str_split(b, ' ')[[1]]), by = a]
Os seguintesquase funciona (a menos que haja algumas linhas idênticas na tabela de dados original), mas é feio quandox
tem muitas colunas e copia a coluna b para o resultado, o que eu gostaria de evitar.
> x[, list(str_split(b, ' ')[[1]]), by = list(a,b)]
a b V1
1: 1 12 13 12
2: 1 12 13 13
3: 2 14 15 14
4: 2 14 15 15
5: 3 16 17 16
6: 3 16 17 17
7: 1 18 19 18
8: 1 18 19 19
Qual seria a maneira mais eficiente e idiomática de resolver este problema?