Como carregar dados da seção do HDFS sem remover o arquivo de orige
Quando carregar dados do HDFS para o Hive, usando
LOAD DATA INPATH 'hdfs_file' INTO TABLE tablename;
command, parece que ele está movendo o hdfs_file parahive/warehouse
dir. É possível (como?) Copiá-lo em vez de movê-lo, para que o arquivo seja usado por outro process