Resultados de la búsqueda a petición "bigdata"
¿Cuál es la diferencia real entre Data Warehouse y Big Data?
Sé qué es Data Warehouse y qué es Big Data. Pero estoy confundido con Data Warehouse Vs Big Data. Ambos son iguales con nombres diferentes o ambos son difere...
Cómo reiniciar una tarea fallida en Airflow
Estoy usando unFiscal localy mi dag tiene3 tareasdonde la tarea (C) depende de la tarea (A). La tarea (B) y la tarea (A) pueden ejecutarse en paralelo, algo como a continuación A -> C B Entonces la tarea (A) ha falladoy perola tarea (B) ...
No escribir datos de compensación al cuidador del zoológico en kafka-storm
Estaba configurando un clúster de tormenta para calcular las tendencias en tiempo real y otras estadísticas, sin embargo, tengo algunos problemas al introducir la función de "recuperación" en este proyecto, al permitir el desplazamiento que fue ...
convertir data.frame a ff
Me gustaría convertir un data.frame en un objeto ff, con as.ffdf como se describeaquí
Kafka tema por productor
Digamos que tengo múltiples dispositivos. Cada dispositivo tiene diferentes tipos de sensores. Ahora quiero enviar los datos de cada dispositivo para cada sensor a kafka. Pero estoy confundido acerca de los temas kafka. Para procesar estos datos ...
Procese un gran archivo GEOJson con jq
Dado un archivo GEOJson de la siguiente manera: - { "type": "FeatureCollection", "features": [ { "type": "Feature", "properties": { "FEATCODE": 15014 }, "geometry": { "type": "Polygon", "coordinates": [ ..... Quiero terminar con lo siguiente: ...
¿Cómo acelerar la estimación de GLM?
Estoy utilizando RStudio 0.97.320 (R 2.15.3) en Amazon EC2. Mi marco de datos tiene 200k filas y 12 columnas.Estoy tratando de ajustar una regresión logístic...
Apache Drill vs Spark
Tengo cierta experiencia con Apache Spark y Spark-SQL. Recientemente encontré el proyecto Apache Drill. ¿Podría describirme cuáles son las ventajas / diferencias más significativas entre ellos? Ya he leidoAnálisis rápido de Hadoop ...
¿Cómo envío los resultados de una consulta de HiveQL a CSV?
nos gustaría poner los resultados de una consulta de Hive a un archivo CSV. Pensé que el comando debería verse así:
Spark data type adivinador UDAF
Quería tomar algo como esto https://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java [https://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java]y cree un HDAF Hive para crear una función agregada que ...