PySpark: cuspir arquivo único ao escrever em vez de vários arquivos de peça

Question

Mar 22, 2016, 07:09 PM

apache-spark pyspark amazon-s3 apache-spark-sql python

PySpark: cuspir arquivo único ao escrever em vez de vários arquivos de peça

Existe uma maneira de impedir que o PySpark crie vários arquivos pequenos ao gravar um DataFrame em um arquivo JSON?

Se eu correr:

 df.write.format('json').save('myfile.json')

ou

df1.write.json('myfile.json')

ele cria a pasta chamadamyfile e dentro dele encontro vários arquivos pequenos chamadospart-***, da maneira HDFS. É possível, por qualquer meio, cuspir um único arquivo?

questionAnswers(3)

Perguntas populares

0 a resposta

Por que "vetorizar" esse loop R simples dá um resultado diferent

0 a resposta

Verifique qual formulário tem um erro

0 a resposta

VS Code. Como abrir configurações JSON com padrões

0 a resposta

como definir o cabeçalho de sabão usando o ksoap2 - android

0 a resposta

Gerando despejos de colisão do .NET automaticamente

Você é muito ativo! É ótimo!

PySpark: cuspir arquivo único ao escrever em vez de vários arquivos de peça

questionAnswers(3)

yourAnswerToTheQuestion

Perguntas populares