Aleatoriamente vários arquivos na mesma ordem
Configuração:
Eu tenho 50 arquivos, cada um com 25000 linhas.
Façam:
Eu preciso embaralhar todos eles "na mesma ordem". Por exemplo.:
Se antes da reprodução aleatória:
File 1 File 2 File 3
A A A
B B B
C C C
depois do shuffle, devo obter:
File 1 File 2 File 3
B B B
C C C
A A A
ou seja, as linhas correspondentes nos arquivos devem ser embaralhadas na mesma ordem.
Além disso, o shuffle deve ser determinístico, ou seja, se eu der o arquivo A como entrada, ele sempre deve produzir a mesma saída shuffled.
Eu posso escrever um programa Java para fazer isso, provavelmente um script para. Algo como, embaralhe o número entre 1 e 25000 e armazene-o em um arquivo, digamos shuffle_order. Em seguida, basta processar um arquivo de cada vez e solicitar as linhas existentes de acordo com shuffle_order. Mas existe uma maneira melhor / rápida de fazer isso?
Entre em contato se precisar de mais informações.