Como posso particionar uma tabela com o HIVE?

Estou brincando com o Hive há alguns dias, mas ainda tenho dificuldades com a partiçã

Estou gravando logs do Apache (formato Combinar) no Hadoop há alguns meses. Eles são armazenados no formato de texto de linha, particionados por data (via canal): / logs / aaaa / mm / dd / hh / *

Exemplo

/logs/2012/02/10/00/Part01xx (02/10/2012 12:00 am)
/logs/2012/02/10/00/Part02xx
/logs/2012/02/10/13/Part0xxx (02/10/2012 01:00 pm)

A data no log combinado arquivo segue este formato [10 / fev / 2012: 00: 00: 00 -0800]

Como posso criar uma tabela externa com partição no Hive que use minha partição física. Não consigo encontrar nenhuma boa documentação na partição Hive. Encontrei perguntas relacionadas, como:

Importação de dados do HDFS para a tabela Hiveoluna @partition na seção

Se eu carregar meus logs em uma tabela externa com o Hive, não posso particionar com o tempo, pois não é o bom formato (02 de fevereiro <=>). Mesmo se estiver em um bom formato, como posso transformar uma string "10/02/2012: 00: 00: 00 -0800" em vários diretórios "/ 2012/02/10/00"?

Eu poderia eventualmente usar o script pig para converter meus logs brutos em tabelas de colmeia, mas neste momento eu deveria apenas usar pig em vez de colmeia para fazer meus relatório

questionAnswers(2)

yourAnswerToTheQuestion