Resultados de la búsqueda a petición "data.table"

1 la respuesta

Qué sintaxis data.table para combinación izquierda (una columna) para preferir

¿Cómo debo comenzar a pensar qué sintaxis prefiero? Mi criterio es la eficiencia (este es el número uno) y también legibilidad / mantenibilidad. Est A <- B[A, on = .(id)] # wow such. concisionO es A[B, on = .(id), comment := i.comment]O ...

4 la respuesta

subconjunto en data.table

Estoy tratando de subconjugar un data.table (del paquetetabla de dato [http://cran.r-project.org/web/packages/data.table/index.html]) en R (no es un data.frame). Tengo un año de 4 dígitos como clave. Me gustaría subconjunto tomando una serie de ...

2 la respuesta

Lista más eficiente para el método data.frame?

Solo tuvimos una conversación con compañeros de trabajo sobre esto, y pensamos que valdría la pena ver lo que la gente en SO land tenía que decir. Supongamos que tengo una lista con N elementos, donde cada elemento es un vector de longitud X. ...

2 la respuesta

La forma más rápida de subconjunto - data.table vs. MySQL

Soy un usuario R, y con frecuencia encuentro que necesito escribir funciones que requieran subconjuntos de grandes conjuntos de datos (10 millones de filas). Cuando aplico tales funciones en un gran número de observaciones, puede llevar mucho ...

1 la respuesta

Utilizando fechas con el paquete data.table

ecientemente descubrí el paquete data.table y ahora me preguntaba si debería reemplazar parte de mi código plyr. Para resumir, realmente me gusta plyr y básicamente logré todo lo que quería. Sin embargo, mi código se ejecuta un tiempo y la ...

8 la respuesta

a forma más rápida de reemplazar NA en una tabla de datos grande

Tengo una grantabla de dato [http://cran.r-project.org/web/packages/data.table/index.html], con muchos valores perdidos dispersos en sus ~ 200k filas y 200 columnas. Me gustaría volver a codificar esos valores de NA a ceros de la manera más ...

2 la respuesta

Extrayendo filas únicas de una tabla de datos en R [duplicado]

Esta pregunta ya tiene una respuesta aquí: Filtrando filas duplicadas / no únicas en data.table [/questions/11792527/filtering-out-duplicated-non-unique-rows-in-data-table] 3 respuestas Estoy migrando de marcos de datos y matrices a tablas de ...

14 la respuesta

Reemplazo de NA con el último valor que no sea de NA

En un data.frame (o data.table), me gustaría "completar" NA con el valor anterior que no sea NA más cercano. Un ejemplo simple, usando vectores (en lugar de unadata.frame) es el siguiente > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Me gustaría ...

2 la respuesta

¿Cómo se agregan y resumen datos rápidamente?

Tengo un conjunto de datos cuyos encabezados se ven así: PID Time Site Rep Count Quiero sumar elCount porRep para cadaPID x Time x Site combo en el data.frame resultante, quiero obtener el valor medio deCount paraPID x Time x Site combo. a ...

3 la respuesta

¿Por qué se ejecuta "único" más rápido en un marco de datos que una matriz en R?

He comenzado a creer que los marcos de datos no tienen ventajas sobre las matrices, excepto por conveniencia de notación. Sin embargo, noté esta rareza al ejecutarunique en matrices y marcos de datos: parece correr más rápido en un marco de ...