Necessidade Spark do HDFS

Question

Aug 13, 2016, 12:44 AM

Necessidade Spark do HDFS

Oi alguém pode me explicar, o Apache 'Spark Standalone' precisa de HDFS?

Se necessário, como o Spark usa o tamanho do bloco HDFS durante a execução do aplicativo Spark. Quero dizer, estou tentando entender qual será a função do HDFS durante a execução do aplicativo Spark.

A documentação do Spark diz que o paralelismo de processamento é controlado pelas partições RDD e pelos executores / núcleos.

Alguém por favor pode me ajudar a entender.

questionAnswers(1)

Perguntas populares

0 a resposta

Obtenha "RuntimeError: gerador gerado StopIteration" ao tentar atualizar um dataframe do Pandas

0 a resposta

SQL: agregando strings juntos

0 a resposta

Criando um cliente de serviço da web com uma wsdl conhecida mas inacessível

0 a resposta

Tarifas de reserva de hotéis SQL Problem

0 a resposta

Rails - o ActionMailer às vezes mostra anexos antes do conteúdo do email?

Você é muito ativo! É ótimo!

Necessidade Spark do HDFS

questionAnswers(1)

yourAnswerToTheQuestion

Perguntas populares