Resultados de la búsqueda a petición "data-processing"

3 la respuesta

Manejo de datos faltantes / incompletos en R: ¿hay función para enmascarar pero no eliminar NA?

Como es de esperar de un DSL dirigido al análisis de datos, R maneja muy bien los datos faltantes / incomp, lete muy bien, por ejemplo: Muchas funciones R tienen unna.rmmarcar que cuando se establece enCIERTO, elimine las NA: >>> v = mean( c(5, ...

7 la respuesta

¿Cómo suavizar una curva de la manera correcta?

Asumamos que tenemos un conjunto de datos que puede ser dado aproximadamente por

1 la respuesta

Pandas Dataframe seleccionando grupos con mínima cardinalidad

Tengo un problema en el que necesito tomar grupos de filas de un marco de datos donde el número de elementos en un grupo excede un cierto número (límite). Para esos grupos, necesito tomar algunas filas de la cabeza y la fila de la cola. Estoy ...

4 la respuesta

Cómo leer un archivo de 4 GB en un sistema de 32 bits

En mi caso tengo diferentes archivos, supongamos que tengo un archivo> 4GB con datos. Quiero leer ese archivo línea por línea y procesar cada línea. Una de mis restricciones es que el software debe ejecutarse en MS Windows de 32 bits o en 64 bits ...

4 la respuesta

¿Formas de leer solo columnas seleccionadas de un archivo en R? (¿Un medio feliz entre `read.table` y` scan`?) [Duplicado]

Esta pregunta ya tiene una respuesta aquí: Solo lee un número limitado de columnas [/questions/5788117/only-read-limited-number-of-columns] 3 respuestasTengo algunos archivos de datos delimitados muy grandes yQuiero procesar solo ...

3 la respuesta

Procesamiento de datos a gran escala Hbase vs Cassandra [cerrado]

Estoy a punto de aterrizar en Cassandra después de mi investigación sobre soluciones de almacenamiento de datos a gran escala. Pero generalmente se dice que Hbase es una mejor solución para el procesamiento y análisis de datos a ...

1 la respuesta

Procesamiento de datos con agregar columnas dinámicamente en el marco de datos de Python Pandas

Tengo el siguiente problema. Digamos que este es mi CSV id f1 f2 f3 1 4 5 5 1 3 1 0 1 7 4 4 1 4 3 1 1 1 4 6 2 2 6 0 ..........Entonces, tengo filas que se pueden agrupar por id. Quiero crear un csv como a continuación como salida. f1 f2 f3 f1_n ...