Resultados de la búsqueda a petición "apache-spark-sql"

Quiero crear enDataFrame con un esquema especificado en Scala. He intentado usar la lectura JSON (quiero decir, leer un archivo vacío) pero no creo que sea la mejor práctica.

apache-spark

2 la respuesta

¿Cómo acceder a las tablas RDD a través de Spark SQL como un motor de consultas distribuidas JDBC?

Varias publicaciones en stackoverflow tienen respuestas con información parcial sobre cómo acceder a las tablas RDD a través de Spark SQL como un motor de consultas distribuidas JDBC. Así que me gustaría hacer las siguientes preguntas para ...

hive pyspark apache-spark rdd

4 la respuesta

PySpark: mapear un SchemaRDD en un SchemaRDD

Estoy cargando un archivo de objetos JSON como PySparkSchemaRDD. Quiero cambiar la "forma" de los objetos (básicamente, los estoy aplanando) y luego insertarlos en una tabla de Hive. El problema que tengo es que lo siguiente devuelve ...

apache-spark scala dataframe

1 la respuesta

Uso del método de chispa DataFrame "como"

estoy mirando aspark.sql.DataFrame [https://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.sql.DataFrame] documentación. Ahi esta def as(alias: String): DataFrame Returns a new DataFrame with an alias set. Since 1.3.0¿Cuál ...

apache-spark elasticsearch etl scala

2 la respuesta

Cómo agregar una nueva columna Struct a un DataFrame

Actualmente estoy tratando de extraer una base de datos de MongoDB y usar Spark para ingerir ElasticSearch congeo_points. La base de datos de Mongo tiene valores de latitud y longitud, pero ElasticSearch requiere que se incluyan en elgeo_point ...

memory hadoop java apache-spark

1 la respuesta

Siempre aumentando la memoria física para una aplicación Spark en YARN

Estoy ejecutando una aplicación Spark en YARN que tiene dos ejecutores con Xms / Xmx como 32 GB y spark.yarn.excutor.memoryOverhead como 6 GB. Estoy viendo que la memoria física de la aplicación está aumentando y finalmente el administrador de ...

apache-spark aggregate-functions

5 la respuesta

Reemplazo SPARK SQL para la función agregada mysql GROUP_CONCAT

Tengo una tabla de dos columnas de tipo cadena (nombre de usuario, amigo) y para cada nombre de usuario, quiero recopilar todos sus amigos en una fila, concatenados como cadenas ('nombre de usuario1', 'amigos1, amigos2, amigos3'). Sé que MySql ...

rdd scala apache-spark apache-spark-mllib

1 la respuesta

Conversión de RDD a La LabelPoint

Si tengo un RDD con aproximadamente 500 columnas y 200 millones de filas, yRDD.columns.indexOf("target", 0) muestraInt = 77 que me dice que mi variable dependiente objetivo está en la columna número 77. Pero no tengo suficiente conocimiento sobre ...

hiveql hive udf apache-spark

1 la respuesta

Colmena UDF para seleccionar todo excepto algunas columnas

El patrón común de creación de consultas en HiveQL (y SQL en general) es seleccionar todas las columnas (SELECT *) o un conjunto de columnas explícitamente especificado (SELECT A, B, C) SQL no tiene un mecanismo incorporado para seleccionar todos ...

pyspark apache-spark

2 la respuesta

La consulta de Spark funciona muy lentamente

Tengo un clúster en AWS con 2 esclavos y 1 maestro. Todas las instancias son de tipo m1.large. Estoy ejecutando la versión 1.4 de spark. Estoy comparando el rendimiento de la chispa sobre 4 millones de datos provenientes del cambio rojo. Disparé ...

Página 34 de 52

32 333435 36

Resultados de la búsqueda a petición "apache-spark-sql"

¿Cómo crear un DataFrame vacío con un esquema especificado?

¿Cómo acceder a las tablas RDD a través de Spark SQL como un motor de consultas distribuidas JDBC?

PySpark: mapear un SchemaRDD en un SchemaRDD

Etiquetas Populares

Uso del método de chispa DataFrame "como"

Cómo agregar una nueva columna Struct a un DataFrame

Siempre aumentando la memoria física para una aplicación Spark en YARN

Reemplazo SPARK SQL para la función agregada mysql GROUP_CONCAT

Conversión de RDD a La LabelPoint

Colmena UDF para seleccionar todo excepto algunas columnas

La consulta de Spark funciona muy lentamente

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "apache-spark-sql"

Etiquetas Populares