Git encontra todos os arquivos binários no histórico

Desculpe se esta é uma duplicata da pergunta anterior, mas não consegui encontrar exatamente o que estou procurando. Estou no processo de converter um grande conjunto de códigos cvs (mais de 20 repositórios com 15 anos de história - tamanho de 10 a 15 GB) em git. Grande parte do tamanho é devido aos binários que foram confirmados junto com o código no passado. Embora alguns dos binários sejam arquivos que podem ser removidos completamente, é desejável manter muitos deles e também seu histórico. No entanto, não queremos que o repositório fique inchado.

No momento, estamos planejando usargit-fat para armazenar os binários, mas estou escrevendo um script para converter automaticamente os arquivos. Meu primeiro passo é apenas tentar identificar todos os arquivos no repositório (arquivos excluídos incluídos) que são binários. Existem abordagens simples para fazer isso? Obrigado pela ajuda

Editar

Na verdade, acho que encontrei uma abordagem razoável em que apenas corro

git log --numstat <first commit hash> HEAD

Isso imprime uma lista de todos os arquivos com duas colunas na frente, a primeira contém o número de alterações no arquivo (não tenho certeza se está em bytes ou linhas). Mas a parte importante é que, para arquivos binários, é '-'. Selecionando linhas com essa tag e "especificando-as", acredito que recebo a lista completa de arquivos binários.

Existem falhas nessa estratégia?

questionAnswers(3)

yourAnswerToTheQuestion