É possível salvar arquivos no Hadoop sem salvá-los no sistema de arquivos local?
É possível salvar arquivos no Hadoop sem salvá-los no sistema de arquivos local? Gostaria de fazer algo como o mostrado abaixo, no entanto, gostaria de salvar o arquivo diretamente no HDFS. No momento, salvei os arquivos no diretório de documentos e só então posso salvá-los no HDFS, por exemplo, usandohadoop fs -put
.
class DataUploadView(GenericAPIView):
def post(self, request):
myfile = request.FILES['photo']
fs = FileSystemStorage(location='documents/')
filename = fs.save(myfile.name, myfile)
local_path = 'my/path/documents/' + str(myfile.name)
hdfs_path = '/user/user1/' + str(myfile.name)
run(['hadoop', 'fs', '-put', local_path, hdfs_path], shell=True)