Resultados de la búsqueda a petición "data.table"
Qué sintaxis data.table para combinación izquierda (una columna) para preferir
¿Cómo debo comenzar a pensar qué sintaxis prefiero? Mi criterio es la eficiencia (este es el número uno) y también legibilidad / mantenibilidad. Est A <- B[A, on = .(id)] # wow such. concisionO es A[B, on = .(id), comment := i.comment]O ...
subconjunto en data.table
Estoy tratando de subconjugar un data.table (del paquetetabla de dato [http://cran.r-project.org/web/packages/data.table/index.html]) en R (no es un data.frame). Tengo un año de 4 dígitos como clave. Me gustaría subconjunto tomando una serie de ...
Lista más eficiente para el método data.frame?
Solo tuvimos una conversación con compañeros de trabajo sobre esto, y pensamos que valdría la pena ver lo que la gente en SO land tenía que decir. Supongamos que tengo una lista con N elementos, donde cada elemento es un vector de longitud X. ...
La forma más rápida de subconjunto - data.table vs. MySQL
Soy un usuario R, y con frecuencia encuentro que necesito escribir funciones que requieran subconjuntos de grandes conjuntos de datos (10 millones de filas). Cuando aplico tales funciones en un gran número de observaciones, puede llevar mucho ...
Utilizando fechas con el paquete data.table
ecientemente descubrí el paquete data.table y ahora me preguntaba si debería reemplazar parte de mi código plyr. Para resumir, realmente me gusta plyr y básicamente logré todo lo que quería. Sin embargo, mi código se ejecuta un tiempo y la ...
a forma más rápida de reemplazar NA en una tabla de datos grande
Tengo una grantabla de dato [http://cran.r-project.org/web/packages/data.table/index.html], con muchos valores perdidos dispersos en sus ~ 200k filas y 200 columnas. Me gustaría volver a codificar esos valores de NA a ceros de la manera más ...
Extrayendo filas únicas de una tabla de datos en R [duplicado]
Esta pregunta ya tiene una respuesta aquí: Filtrando filas duplicadas / no únicas en data.table [/questions/11792527/filtering-out-duplicated-non-unique-rows-in-data-table] 3 respuestas Estoy migrando de marcos de datos y matrices a tablas de ...
Reemplazo de NA con el último valor que no sea de NA
En un data.frame (o data.table), me gustaría "completar" NA con el valor anterior que no sea NA más cercano. Un ejemplo simple, usando vectores (en lugar de unadata.frame) es el siguiente > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Me gustaría ...
¿Cómo se agregan y resumen datos rápidamente?
Tengo un conjunto de datos cuyos encabezados se ven así: PID Time Site Rep Count Quiero sumar elCount porRep para cadaPID x Time x Site combo en el data.frame resultante, quiero obtener el valor medio deCount paraPID x Time x Site combo. a ...
¿Por qué se ejecuta "único" más rápido en un marco de datos que una matriz en R?
He comenzado a creer que los marcos de datos no tienen ventajas sobre las matrices, excepto por conveniencia de notación. Sin embargo, noté esta rareza al ejecutarunique en matrices y marcos de datos: parece correr más rápido en un marco de ...