Resultados de la búsqueda a petición "apache-spark"

Soy nuevo en la programación de Scala y esta es mi pregunta: ¿Cómo contar el número de cadenas para cada fila? Mi Dataframe se compone de una sola columna de tipo Array [String]. friendsDF: org.apache.spark.sql.DataFrame = [friends: array<string>]

scala apache-spark-sql apache-spark-dataset apache-spark-encoders

2 la respuesta

¿Cómo crear un conjunto de datos de mapas?

Estoy usando Spark 2.2 y estoy teniendo problemas al intentar llamarspark.createDataset en unSeq deMap. El código y la salida de mi sesión de Spark Shell siguen: // createDataSet on Seq[T] where T = Int works scala> ...

scala intellij-idea apache-spark-sql hdfs

1 la respuesta

¿Cómo puede leer dataframereader http?

Mi entorno de desarrollo: IntellijMavenScala2.10.6win7 x64Dependencias: <dependencies>  <dependency> ...

apache-spark-dataset apache-spark-sql

1 la respuesta

¿Cómo encontrar los primeros valores no nulos en grupos? (clasificación secundaria usando la API de conjunto de datos)

Estoy trabajando en un conjunto de datos que representa una secuencia de eventos (como los eventos de seguimiento de un sitio web). Todos los eventos tienen una marca de tiempo. Un caso de uso que a menudo tenemos es tratar de encontrar el primer ...

spark-dataframe rdd apache-spark-2.0 bigdata

2 la respuesta

Partición de parquet Spark: gran cantidad de archivos

Estoy tratando de aprovechar la partición de chispas. Estaba tratando de hacer algo como data.write.partitionBy("key").parquet("/location")El problema aquí es que cada partición crea una gran cantidad de archivos de parquet que resultan en ...

pyspark spark-dataframe

3 la respuesta

Pyspark: Pase múltiples columnas en UDF

Estoy escribiendo una función definida por el usuario que tomará todas las columnas excepto la primera en un marco de datos y sumará (o cualquier otra operación). Ahora el marco de datos a veces puede tener 3 columnas o 4 columnas o más. ...

python pyspark

3 la respuesta

PySpark reemplaza nulo en columna con valor en otra columna

Quiero reemplazar los valores nulos en una columna con los valores en una columna adyacente, por ejemplo, si tengo A|B 0,1 2,null 3,null 4,2Quiero que sea: A|B 0,1 2,2 3,3 4,2Probado con df.na.fill(df.A,"B")Pero no funcionó, dice que el valor ...

apache-kafka spark-structured-streaming

3 la respuesta

¿Cómo escribir un conjunto de datos de transmisión a Kafka?

Estoy tratando de enriquecer los datos de los temas. Por lo tanto, lea desde Kafka hasta Kafka utilizando la transmisión estructurada de Spark. val ds = spark.readStream .format("kafka") .option("kafka.bootstrap.servers", bootstrapServers) ...

pyspark apache-spark-mllib apache-spark-ml

1 la respuesta

Spark ML Pipeline con RandomForest lleva demasiado tiempo en un conjunto de datos de 20 MB

Estoy usando Spark ML para ejecutar algunos experimentos de ML y en un pequeño conjunto de datos de 20 MB (Conjunto de datos de póker [http://archive.ics.uci.edu/ml/machine-learning-databases/poker/poker-hand-testing.data] ) y un bosque aleatorio ...

temp-tables global-temp-tables

1 la respuesta

¿Diferencia entre createTempview y createGlobaltempview y CreateorReplaceTempview en spark 2.1?

Cuál es la diferencia entrecreateTempview ycreateGlobaltempview yCreateorReplaceTempview en chispa 2.1 ??

Página 65 de 165

63 646566 67

Resultados de la búsqueda a petición "apache-spark"

Obtener el tamaño / longitud de una columna de matriz

¿Cómo crear un conjunto de datos de mapas?

¿Cómo puede leer dataframereader http?

Etiquetas Populares

¿Cómo encontrar los primeros valores no nulos en grupos? (clasificación secundaria usando la API de conjunto de datos)

Partición de parquet Spark: gran cantidad de archivos

Pyspark: Pase múltiples columnas en UDF

PySpark reemplaza nulo en columna con valor en otra columna

¿Cómo escribir un conjunto de datos de transmisión a Kafka?

Spark ML Pipeline con RandomForest lleva demasiado tiempo en un conjunto de datos de 20 MB

¿Diferencia entre createTempview y createGlobaltempview y CreateorReplaceTempview en spark 2.1?

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "apache-spark"

Etiquetas Populares