Resultados de la búsqueda a petición "pyspark-sql"

Tengo un DataFrame (llamadodf1 en Pyspark en el que una de las columnas es de tipoDenseVector. Este es el esquema del marco de datos. DataFrame[prediction: double, probability: vector, label: double]Intento convertirlo en un RDD usandodf1.rdd ...

pyspark mysql docker jdbc

1 la respuesta

pyspark mysql jdbc load Se produjo un error al llamar a o23.load No hay controlador adecuado

Yo uso docker imagesecuencia / chispa [https://hub.docker.com/r/sequenceiq/spark/]en mi Mac para estudiar estos ejemplos de chispa [http://spark.apache.org/examples.html], durante el proceso de estudio, actualizo la chispa dentro de esa imagen a ...

apache-spark postgresql jdbc pyspark

3 la respuesta

Trabajando con jdbc jar en pyspark

Necesito leer de una base de datos sql de postgres en pyspark. Sé que esto se ha preguntado antes, comoaquí [https://stackoverflow.com/questions/29669420/not-able-to-connect-to-postgres-using-jdbc-in-pyspark-shell] , ...

Etiquetas Populares

saxon tabpage clickjacking gevent signing solr-schema h,tml sticky type-families syscache qthread surefire error-reporting sse2 executorservice appdata matcher horizontalscrollview jet amazon-sqs

apache-spark apache-spark-sql pyspark

2 la respuesta

Cómo almacenar en caché un marco de datos de Spark y hacer referencia a él en otro script

¿Es posible almacenar en caché un marco de datos y luego hacer referencia (consultarlo) en otro script? ... Mi objetivo es el siguiente: En el script 1, cree un marco de datos (df)Ejecute el script 1 y la memoria caché dfEn el script 2, consulta ...

apache-spark python pyspark apache-spark-sql

3 la respuesta

Pyspark DataFrame UDF en columna de texto

Estoy tratando de hacer una limpieza de texto NLP de algunas columnas Unicode en un PySpark DataFrame. He intentado en Spark 1.3, 1.5 y 1.6 y parece que no puedo hacer que las cosas funcionen para mí. También he intentado usar Python 2.7 y Python ...

python pandas apache-spark pyspark

4 la respuesta

¿Cómo crear un DataFrame a partir de filas mientras se conserva el esquema existente?

Si llamo mapa omapPartition y mi función recibe filas de PySpark, ¿cuál es la forma natural de crear un PySpark local o un Pandas DataFrame? ¿Algo que combine las filas y conserve el esquema? Actualmente hago algo como: def combine(partition): ...

python pyspark apache-spark

10 la respuesta

¿Cómo cambiar los nombres de columna del marco de datos en pyspark?

Vengo de antecedentes de pandas y estoy acostumbrado a leer datos de archivos CSV en un marco de datos y luego simplemente cambiar los nombres de columna a algo útil usando el comando simple: df.columns = new_column_name_listSin embargo, lo ...

pyspark python apache-spark-sql apache-spark

1 la respuesta

PySpark: tome el promedio de una columna después de usar la función de filtro

Estoy usando el siguiente código para obtener la edad promedio de las personas cuyo salario es mayor que algún umbral. dataframe.filter(df['salary'] > 100000).agg({"avg": "age"})la edad de la columna es numérica (flotante) pero todavía recibo ...

Página 5 de 5

1 2 3 45

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "pyspark-sql"

Etiquetas Populares