Spark mejor enfoque de búsqueda de datos para mejorar el rendimiento

Question

Aug 26, 2016, 07:27 PM

Marco de datos A (millones de registros) uno de la columna es create_date, modified_date

Los registros del marco de datos B 500 tienen fecha_inicio y fecha_finalización

Enfoque actual:

Select a.*,b.* from a join b on a.create_date between start_date and end_date

El trabajo anterior tarda media hora o más en ejecutarse.

¿Cómo puedo mejorar el rendimiento?

Respuestas a la pregunta(2)

Ruby - ¿cuál es la diferencia entre comillas simples y dobles? [duplicar]

¿Puedo instalar gemas con apt-get en Ubuntu?

Cómo contar el número de registros en sqlite en Android

Sql Azure: ¿servidores separados?

error al enlazar una cadena de recursos con una vista en wpf