Resultados de la búsqueda a petición "bigdata"
¿Por qué el rendimiento del consumidor de Kafka es lento?
Tengo un tema simple y un consumidor y productor de Kafka simple, usando la configuración predeterminada. El programa es muy simple, tengo dos hilos. En el productor, sigue enviando datos de 16 bytes. Y en el lado del consumidor, sigue ...
R foverlaps equivalente en Python
Estoy tratando de reescribir un código R en Python y no puedo pasar un bit de código en particular. He encontrado elfoverlaps funcionar en R para ser muy útil al realizar una unión basada en el tiempo, pero no he encontrado nada que funcione tan ...
Postgresql - rendimiento de usar array en una gran base de datos
Digamos que tenemos una tabla con 6 millones de registros. Hay 16 columnas enteras y pocas columnas de texto. Es una tabla de solo lectura, por lo que cada c...
Modelo de datos de Cassandra para series de tiempo.
Estoy trabajando en un modelo de datos de Cassandra para almacenar series de tiempo (soy un novato de Cassandra). Tengo dos aplicaciones: datos de stock intr...
convertir data.frame a ff
Me gustaría convertir un data.frame en un objeto ff, con as.ffdf como se describeaquí
R: expandir un factor R en columnas ficticias para cada nivel de factor
Tengo un marco de datos bastante grande en R con dos columnas. Estoy tratando de hacer deCode columna (factor escriba con 858 niveles) las variables ficticias. El problema es que R Studio siempre se bloquea cuando intento hacer eso. > str(d) ...
Cargar matriz JSON en Pig
Tengo un archivo json con el siguiente formato [ { "id": 2, "createdBy": 0, "status": 0, "utcTime": "Oct 14, 2014 4:49:47 PM", "placeName": "21/F, Cunningham Main Rd, Sampangi Rama NagarBengaluruKarnatakaIndia", "longitude": 77.5983817, ...