En R, ¿cómo recorre las filas de un marco de datos realmente rápido?
Suponga que tiene un marco de datos con muchas filas y muchas columnas.
Las columnas tienen nombres. Desea acceder a las filas por número y a las columnas por nombre.
Por ejemplo, una forma (posiblemente lenta) de recorrer las filas es
for (i in 1:nrow(df)) {
print(df[i, "column1"])
# do more things with the data frame...
}
Otra forma es crear "listas" para columnas separadas (comocolumn1_list = df[["column1"]
) y acceda a las listas en un bucle. Este enfoque puede ser rápido, pero también inconveniente si desea acceder a muchas columnas.
¿Hay una forma rápida de recorrer las filas de un marco de datos? ¿Hay alguna otra estructura de datos mejor para hacer un bucle rápido?