¿Cómo elimino los tweets vacíos usando filter () en pyspark?
¿Cómo elimino los tweets vacíos usandofilter()
en pyspark? He hecho lo siguiente
tweets = sc.textFile(.....)
tweets.count()
el resultado me da 13995. Sin embargo, cuando importé t, los datos de mongodb mostraron 11186
Parece que no puedo aplicar elfilter()
comando para eliminar los tweets vacíos. Ayuda por favor.