Resultados de la búsqueda a petición "apache-spark-sql"

Tengo los siguientes fragmentos de código y me pregunto cuál es la diferencia entre estos dos y cuál debo usar. Estoy usando la chispa 2.2. Dataset<Row> df = sparkSession.readStream() .format("kafka") ...

scala apache-spark spark-dataframe

1 la respuesta

Spark 2.2 Scala DataFrame selecciona del conjunto de cadenas, detectando errores

Soy nuevo en SparkSQL / Scala y estoy luchando con un par de tareas aparentemente simples. Estoy tratando de construir un SQL dinámico a partir de una matriz de cadenas Scala. Estoy tratando de volver a escribir algunas columnas en mi ...

scala apache-spark

1 la respuesta

¿Cómo explotar una columna separada por espacios?

Tengo un marco de datos de muestra en Spark Scala que contiene una columna y muchas otras columnas 50+ y necesito explotar id: datos de ejemplo: id name address 234 435 567 auh aus 345 123 muji ukdatos resultantes: id name address 234 auh aus ...

scala apache-spark dataframe

2 la respuesta

Causado por: java.lang.NullPointerException en org.apache.spark.sql.Dataset

A continuación proporciono mi código. I iterar sobre el DataFrameprodRows y para cadaproduct_PK Encuentro una sublista coincidente de product_PKs deprodRows. numRecProducts = 10 var listOfProducts: Map[Long,Array[(Long, Int)]] = ...

apache-spark spark-structured-streaming uberjar

2 la respuesta

¿Por qué el formato ("kafka") falla con "No se pudo encontrar la fuente de datos: kafka" (incluso con uber-jar)?

Yo uso HDP-2.6.3.0 con el paquete Spark2 2.2.0. Estoy tratando de escribir un consumidor de Kafka, usando la API de transmisión estructurada, pero obtengo el siguiente error después de enviar el trabajo al clúster: Exception in thread "main" ...

apache-spark pyspark pyspark-sql

1 la respuesta

Aplicar una transformación a múltiples columnas pyspark dataframe

scala apache-spark

1 la respuesta

Los nombres de las columnas del marco de datos entran en conflicto con. (Punto)

Tengo un DataFramedf que tiene este esquema: root |-- person.name: string (nullable = true) |-- person: struct (nullable = true) | |-- age: long (nullable = true) | |-- name: string (nullable = true) Cuando lo hagodf.select("person.name") ...

python apache-spark pyspark

1 la respuesta

Columna GroupBy y filas de filtro con valor máximo en Pyspark

Estoy casi seguro de que esto se ha preguntado antes, perouna búsqueda a través de ...

apache-spark

1 la respuesta

¿Cómo usar UDF para devolver múltiples columnas?

scala apache-spark apache-spark-xml

1 la respuesta

Agregar parte de la columna del esquema principal al elemento secundario en JSON anidado en el marco de datos de chispa

Tengo debajo de xml que estoy tratando de cargar en el marco de datos de chispa. <?xml version="1.0"?> <env:ContentEnvelope xsi:schemaLocation="http"> <env:Header> ...

Página 27 de 52

25 262728 29

Resultados de la búsqueda a petición "apache-spark-sql"

¿Cuál es la diferencia entre SparkSession.sql y Dataset.sqlContext.sql?

Spark 2.2 Scala DataFrame selecciona del conjunto de cadenas, detectando errores

¿Cómo explotar una columna separada por espacios?

Etiquetas Populares

Causado por: java.lang.NullPointerException en org.apache.spark.sql.Dataset

¿Por qué el formato ("kafka") falla con "No se pudo encontrar la fuente de datos: kafka" (incluso con uber-jar)?

Aplicar una transformación a múltiples columnas pyspark dataframe

Los nombres de las columnas del marco de datos entran en conflicto con. (Punto)

Columna GroupBy y filas de filtro con valor máximo en Pyspark

¿Cómo usar UDF para devolver múltiples columnas?

Agregar parte de la columna del esquema principal al elemento secundario en JSON anidado en el marco de datos de chispa

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "apache-spark-sql"

Etiquetas Populares