Resultados de la búsqueda a petición "user-defined-functions"

1 la respuesta

¿Cómo encontrar la media de las columnas vectoriales agrupadas en Spark SQL?

He creado unRelationalGroupedDataset llamandoinstances.groupBy(instances.col("property_name")): val x = instances.groupBy(instances.col("property_name"))¿Cómo compongo unfunción agregada definida por el ...

3 la respuesta

utilizando una hoja en una función definida por el usuario de Excel

El VBA que estoy tratando de escribir es bastante simple, pero nunca he escrito VBA y desde el estudio visual y el mundo de C #, ¡esto es realmente un infierno! Así que realmente agradeceré cualquier ayuda / consejos / sugerencias ...

1 la respuesta

¿Ejecutar la función con valores de tabla en varias filas?

Dada una función con valores de tabla comodbo.Split() de"T-SQL: opuesto a la concatenación de cadenas: cómo dividir cadenas en varios ...

2 la respuesta

La cadena de la columna de chispa se reemplaza cuando está presente en otra columna (fila)

Me gustaría eliminar cadenas decol1 que están presentes encol2: val df = spark.createDataFrame(Seq( ("Hi I heard about Spark", "Spark"), ("I wish Java could use case classes", "Java"), ("Logistic regression models are neat", "models") ...

2 la respuesta

Acerca de cómo agregar una nueva columna a un DataFrame existente con valores aleatorios en Scala

Tengo un marco de datos con un archivo de parquet y tengo que agregar una nueva columna con algunos datos aleatorios, pero necesito que esos datos aleatorios sean diferentes entre sí. Este es mi código real y la versión actual de spark ...

1 la respuesta

Devolver nombres de columnas si hay coincidencias en la fila, buscando coincidencias múltiples [duplicado]

Esta pregunta ya tiene una respuesta aquí: Concatenar encabezados de columna si el valor en las filas a continuación no está en blanco [/questions/43104790/concatenate-column-headers-if-value-in-rows-below-is-non-blank] 1 respuestaTengo una ...

1 la respuesta

Utilice un método dentro de una función UDF Spark Scala

Quiero usar un método ubicado en otra clase dentro de una función diseñada por el usuario, pero no funciona. Tengo un metodo: def traitementDataFrameEleve(sc:SparkSession, dfRedis:DataFrame, domainMail:String, dir:String):Boolean ={ def ...

1 la respuesta

Spark UDAF con ArrayType como problemas de rendimiento de bufferSchema

Estoy trabajando en un UDAF que devuelve una variedad de elementos. La entrada para cada actualización es una tupla de índice y valor. Lo que hace el UDAF es sumar todos los valores bajo el mismo índice. Ejemplo: Para entrada (índice, valor): ...

1 la respuesta

PySpark 2.1: Importar módulo con UDF rompe la conectividad de Hive

Actualmente estoy trabajando con Spark 2.1 y tengo un script principal que llama a un módulo auxiliar que contiene todos mis métodos de transformación. En otras palabras: main.py helper.pyEn la parte superior de mihelper.py archivo Tengo varias ...

1 la respuesta

Con qué frecuencia se utiliza el procedimiento almacenado xyz o la función de valor de tabla - SQL Server 2008 R2

Tenemos varias vistas, procesos almacenados, valores de tabla y funciones escalares. ¿Cómo podemos ver con qué frecuencia o incluso cuántas veces se han llamado desde SQL Server? ¿Necesitamos editar cada uno para actualizar una tabla en cada ...