fread (): tabla de lectura con \ r \ r \ n como símbolo de nueva línea
Tengo tablas delimitadas por tabulaciones en archivos de texto donde todas las líneas terminan con\r\r\n
(0x0D 0x0D 0x0A
) Si trato de leer dicho archivo confread()
, dice
El final de línea es \ r \ r \ n. R's download.file () parece agregar el \ r adicional en modo texto en Windows. Vuelva a descargar en modo binario (mode = 'wb'), que también podría ser más rápido. Alternativamente, pase la URL directamente a fread y descargará el archivo en modo binario por usted.
pero no estoy descargando estos archivos, ya los tengo.
Hasta ahora llegué a la solución que primero lee el archivo conread.table()
(trata\r\r\n
combinación como un solo carácter de fin de línea), luego convierte el resultadodata.frame
pordata.table()
:
mydt <- data.table(read.table(myfilename, header = T, sep = '\t', fill = T))
pero me pregunto si hay alguna forma de evitar la lentitudread.table()
y usar rápidofread()
en lugar.