Calcular a média de cada coluna ignorando os dados ausentes com awk

Question

Nov 25, 2015, 05:00 PM

Calcular a média de cada coluna ignorando os dados ausentes com awk

Eu tenho uma grande tabela de dados separados por tabulação com milhares de linhas e dezenas de colunas e faltam dados marcados como "na". Por exemplo,

na  0.93    na  0   na  0.51
1   1   na  1   na  1
1   1   na  0.97    na  1
0.92    1   na  1   0.01    0.34

Gostaria de calcular a média de cada coluna, mas certificando-me de que os dados ausentes sejam ignorados no cálculo. Por exemplo, a média da coluna 1 deve ser 0,97. Eu acredito que eu poderia usarawk mas não tenho certeza de como criar o comando para fazer isso em todas as colunas e levar em consideração os dados ausentes.

Tudo o que sei fazer é calcular a média de uma única coluna, mas trata os dados ausentes como 0, em vez de deixá-los fora do cálculo.

awk '{sum+=$1} END {print sum/NR}' filename

questionAnswers(2)

Perguntas populares

0 a resposta

Javascript, como ler o arquivo local?

0 a resposta

fatal python error pygame pára-quedas

0 a resposta

Crie um menu php que destaque a aba atual

0 a resposta

Obter o nome do arquivo sem extensão?

0 a resposta

Falha ao obter o Place específico do PlaceBuffer

Você é muito ativo! É ótimo!

Calcular a média de cada coluna ignorando os dados ausentes com awk

questionAnswers(2)

yourAnswerToTheQuestion

Perguntas populares