Результаты поиска по запросу "spark-streaming"
spark-submit: --jars не работает
Я создаю систему метрик для задания Spark Streaming, в системе метрики собираются у каждого исполнителя, поэтому источник метрик (класс, используемый для сбо...
Я сделал это, вероятно, 5 разными способами для разных проектов, над которыми я работал с различными требованиями. Самый простой способ - смоделировать разрыв между производителем / потребителем (основываясь на показателях того, сколько элементов в очереди / насколько далеко отстает «текущий» в потоке), и отрегулировать поведение либо производителя, либо потребителя на основе значения этого показателя ( автоматически масштабировать потребителей, или производить другой тип или меньше предметов). Если вы можете описать поведение, вы можете смоделировать и кодировать его.
ичок в распределенной потоковой обработке (Spark). Я прочитал некоторые учебные пособия / примеры, в которых рассказывается о том, как обратное давление приводит к замедлению работы производителя (ов) в ответ на перегрузку потребителей. ...
ForeachRDD выполняется на драйвере?
Я пытаюсь обработать некоторые данные XML, полученные в очереди JMS (QPID), используя потоковую передачу Spark. После получения XML в качестве DStream я прео...
Spark Streaming: StreamingContext не читает файлы данных
Я новичок в Spark Streaming и пытаюсь начать работу с ним, используя Spark-shell. Предполагая, что у меня есть каталог с именем «dataTest», помещенный в корн...
Настраиваемое участие JavaDStreamPairRDD
В потоковой передаче Spark, каков рекомендуемый способ реализации настраиваемого участника на DStreams?Я использовал JavaPairRDD.partitionBy (Partitioner) в ...
Пул соединений в приложении потокового pyspark
Как правильно использовать пулы соединений в приложении потокового pyspark?Я прочиталhttps://forums.databricks.com/questions/3057/how-to-reuse-database-sessi...