Resultados de la búsqueda a petición "bigdata"

3 la respuesta

Rff paquete ffsave 'zip' no encontrado

2 la respuesta

importar datos Json complejos a la colmena

Se requiere un poco de alimentación con cuchara, cómo importar json complejos en la colmena. Json archivo en el formato de:

3 la respuesta

Eliminar unidades duplicadas del marco de datos

Estoy trabajando en un gran conjunto de datos con n covariables. Muchas de las filas son duplicadas. Para identificar los duplicados necesito usar un subconj...

2 la respuesta

Trabajando con big data en python y numpy, no hay suficiente ram, ¿cómo guardar resultados parciales en el disco?

Estoy tratando de implementar algoritmos para datos de 1000 dimensiones con 200k + puntos de datos en python. Quiero usar las bibliotecas numpy, scipy, sklea...

1 la respuesta

Modelo de datos de Cassandra para series de tiempo.

Estoy trabajando en un modelo de datos de Cassandra para almacenar series de tiempo (soy un novato de Cassandra). Tengo dos aplicaciones: datos de stock intr...

3 la respuesta

¿Cómo acelerar la estimación de GLM?

Estoy utilizando RStudio 0.97.320 (R 2.15.3) en Amazon EC2. Mi marco de datos tiene 200k filas y 12 columnas.Estoy tratando de ajustar una regresión logístic...

2 la respuesta

¿Cómo obtener la matriz / bolsa de elementos del grupo Hive por operador?

Quiero agrupar por un campo dado y obtener la salida con campos agrupados. A continuación se muestra un ejemplo de lo que estoy tratando de lograr:Imagine un...

2 la respuesta

actualizando la tabla externa de Hive con cambios HDFS

1 la respuesta

convertir data.frame a ff

Me gustaría convertir un data.frame en un objeto ff, con as.ffdf como se describeaquí

3 la respuesta

¿Es una buena idea generar colecciones por día en mongodb?

¿Es una buena idea crear colecciones por día de datos en un día determinado (podríamos comenzar con por día y luego avanzar por hora si hay demasiados datos)...