Resultados de la búsqueda a petición "apache-spark"

¿Es posible leer archivos pdf / audio / video (datos no estructurados) usando Apache Spark? Por ejemplo, tengo miles de facturas en pdf y quiero leer datos de ellas y realizar algunos análisis sobre eso. ¿Qué pasos debo hacer para procesar datos ...

scala apache-kafka spark-streaming

1 la respuesta

Acceso a la colección de DStreams

Estoy tratando de acceder a una colección de DStreams filtrados obtenidos como en la solución a esta pregunta:Spark Streaming: la mejor manera de dividir el flujo de entrada según el parámetro de ...

pyspark hive

1 la respuesta

En Pyspark HiveContext, ¿cuál es el equivalente de SQL OFFSET?

O una pregunta más específica sería ¿cómo puedo procesar grandes cantidades de datos que no caben en la memoria a la vez? Con OFFSET estaba tratando de hacer hiveContext.sql ("seleccionar ... límite 10 offset 10") mientras incrementaba el offset ...

scala hive apache-spark-sql

2 la respuesta

¿Podemos utilizar múltiples sesiones de chispas para acceder a dos servidores de Hive diferentes?

Tengo un escenario para comparar dos tablas diferentes de origen y destino de dos servidores remotos separados, ¿podemos usar dos?SparkSessions algo como lo intenté a continuación: - val spark = SparkSession.builder().master("local") ...

hadoop docker yarn apache-zeppelin

1 la respuesta

Ejecutar zeppelin en modo de grupo de chispas

Estoy usando este tutorialgrupo de chispas en modo hilo en contenedor acoplable [https://zeppelin.apache.org/docs/0.7.0/install/spark_cluster_mode.html#spark-on-yarn-mode] para lanzar zeppelin en el grupo de chispas en modo hilo. Sin embargo, ...

apache-kafka apache-spark-sql offset spark-structured-streaming

3 la respuesta

¿Cómo obtener compensaciones de Kafka para una consulta estructurada para una gestión de compensación manual y confiable?

Spark 2.2 introdujo una fuente de transmisión estructurada de Kafka. Según tengo entendido, se basa en el directorio de puntos de control HDFS para almacenar compensaciones y garantizar la entrega de un mensaje "exactamente una vez". Pero viejos ...

scala apache-kafka hbase spark-streaming

3 la respuesta

1 la respuesta

¿Cómo entender el tipo de formato de libsvm de Spark MLlib?

Soy nuevo para aprender Spark MLlib. Cuando estaba leyendo sobre el ejemplo de regresión logística binomial, no entiendo el tipo de formato de "libsvm". ( Regresión logística ...

Página 66 de 165

64 656667 68

Resultados de la búsqueda a petición "apache-spark"

¿Es posible leer archivos pdf / audio / video (datos no estructurados) usando Apache Spark?

Acceso a la colección de DStreams

En Pyspark HiveContext, ¿cuál es el equivalente de SQL OFFSET?

Etiquetas Populares

¿Podemos utilizar múltiples sesiones de chispas para acceder a dos servidores de Hive diferentes?

Ejecutar zeppelin en modo de grupo de chispas

¿Cómo obtener compensaciones de Kafka para una consulta estructurada para una gestión de compensación manual y confiable?

Spark Structured Streaming con integración Hbase

Spark: mejor práctica para recuperar grandes datos de RDD a la máquina local

Cómo Spark maneja datos más grandes que la memoria del clúster

¿Cómo entender el tipo de formato de libsvm de Spark MLlib?

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "apache-spark"

Etiquetas Populares