Resultados da pesquisa a pedido "data.table"
fread (): lendo a tabela com \ r \ r \ n como símbolo de nova linha
Tenho tabelas delimitadas por tabulação em arquivos de texto onde todas as linhas terminam com\r\r\n (0x0D 0x0D 0x0A) Se eu tentar ler esse arquivo comfread(), diz O final da linha é \ r \ r \ n. O download.file () de R parece adicionar o ...
A junção de rolagem data.table de R “mult” não está funcionando conforme o esperado
Eu tenho dois data.frames, cada um com uma série temporal. Meu objetivo é usar as séries temporais do df2 para marcar o registro de data e hora mais próximo no df1. Cada registro de data e hora no df2 deve marcar apenas UM registro de data e hora ...
Indexando pedaços de sequência usando data.table
Digamos que eu tenha um conjunto de dados em que as seqüências de comprimento 1 sejam ilegais, o comprimento 2 seja legal, maior que o comprimento 5 seja ilegal, mas é permitido dividir seqüências mais longas em <= 5 seqüências. set.seed(1) DT1 ...
Existe um dplyr equivalente a data.table :: rleid?
data.table oferece uma boa função de conveniência,rleid [https://www.rdocumentation.org/packages/data.table/versions/1.11.4/topics/rleid] para codificação de comprimento de execução: library(data.table) DT = data.table(grp=rep(c("A", "B", "C", ...
Como posso executar uma mesclagem "setdiff" usando data.table?
Digamos que eu tenha duas tabelas: library(data.table) set.seed(1) tab1 <- data.table( let = rep(letters[1:2], each = 3), num = rep(1:3, 2), val = rnorm(6), key = c("let", "num") ) tab2 <- data.table( let = rep(letters[1:2], each = 2), num = ...
R - Crie uma nova variável em que cada observação depende de outra tabela e outras variáveis no quadro de dados
Eu tenho as duas tabelas a seguir: df <- data.frame(eth = c("A","B","B","A","C"),ZIP1 = c(1,1,2,3,5)) Inc <- data.frame(ZIP2 = c(1,2,3,4,5,6,7),A = c(56,98,43,4,90,19,59), B = c(49,10,69,30,10,4,95),C = c(69,2,59,8,17,84,30)) eth ZIP1 ZIP2 A B C ...
Looping grepl () através de data.table (R)
Eu tenho um conjunto de dados armazenado como data.tableDT que se parece com isso: print(DT) category industry 1: administration admin 2: nurse practitioner truck 3: trucking truck 4: administration admin 5: warehousing nurse 6: ...
linha que não consolida duplicatas em R ao usar vários meses no Filtro de Data
Estou usando o código a seguir para resumir meus dados por uma coluna library(data.table, warn.conflicts = FALSE) library(lubridate, warn.conflicts = FALSE) ################ ## PARAMETERS ## ################ # Set path of major source folder for ...
da tabela de dados, selecione aleatoriamente uma linha por grupo
Estou procurando uma maneira eficiente de selecionar linhas de uma tabela de dados para que eu tenha uma linha representativa para cada valor exclusivo em uma coluna específica. Deixe-me propor um exemplo simples: require(data.table) y = ...
dplyr mutate / replace em um subconjunto de linhas
Estou no processo de experimentar um fluxo de trabalho baseado em dplyr (em vez de usar principalmente data.table, com o qual estou acostumado), e me deparei com um problema que não consigo encontrar uma solução dplyr equivalente para ...