Conte linhas em arquivos grandes

Question

Oct 03, 2012, 10:42 PM

Eu costumo trabalhar com arquivos de texto de ~ 20 Gb e me vejo contando o número de linhas em um determinado arquivo com muita freqüência.

O jeito que eu faço agora é sócat fname | wc -le demora muito tempo. Existe alguma solução que seria muito mais rápida?

Eu trabalho em um cluster de alto desempenho com o Hadoop instalado. Eu queria saber se uma abordagem de redução de mapa poderia ajudar.

Eu gostaria que a solução fosse tão simples quanto uma linha, comowc -l solução, mas não tenho certeza de como é viável.

Alguma ideia?

questionAnswers(12)

VBA Excel manipulação de dados grandes levando uma eternidade

Não é possível vincular a 'ngOutletContext', pois não é uma propriedade conhecida de 'ng-template' [duplicado]

Esclarecimento ponteiro para ponteiro

Como salvar a área do cliente de uma janela filho em um arquivo Bitma

Converta esse delegado para um método anônimo ou lambda