Calcular a média de cada coluna ignorando os dados ausentes com awk
Eu tenho uma grande tabela de dados separados por tabulação com milhares de linhas e dezenas de colunas e faltam dados marcados como "na". Por exemplo,
na 0.93 na 0 na 0.51
1 1 na 1 na 1
1 1 na 0.97 na 1
0.92 1 na 1 0.01 0.34
Gostaria de calcular a média de cada coluna, mas certificando-me de que os dados ausentes sejam ignorados no cálculo. Por exemplo, a média da coluna 1 deve ser 0,97. Eu acredito que eu poderia usarawk
mas não tenho certeza de como criar o comando para fazer isso em todas as colunas e levar em consideração os dados ausentes.
Tudo o que sei fazer é calcular a média de uma única coluna, mas trata os dados ausentes como 0, em vez de deixá-los fora do cálculo.
awk '{sum+=$1} END {print sum/NR}' filename