Как удалить пустые твиты, используя filter () в pyspark?
Как удалить пустые твиты с помощьюfilter()
в писпарк? Я сделал следующее
tweets = sc.textFile(.....)
tweets.count()
результат дает мне 13995. Однако когда я импортировал данные из mongodb, он показал 11186
Я не могу применитьfilter()
Команда для удаления пустых твитов. Помогите, пожалуйста.