Como calcular correlações entre todas as colunas em R e detectar variáveis altamente correlacionadas
Eu tenho um grande conjunto de dados com 100 variáveis e 3000 observações. Quero detectar as variáveis (colunas) que são altamente correlacionadas ou redundantes e, assim, remover a dimensonalidade no quadro de dados. Eu tentei isso, mas calcula apenas a correlação entre uma coluna e as outras; e sempre recebo uma mensagem de erro
for(i in 1:ncol(predicteurs)){
correlations <- cor(predicteurs[,i],predicteurs[,2])
names(correlations[which.max(abs(correlations))])
}
Warning messages:
1: In cor(predicteurs[, i], predicteurs[, 2]) :
the standard deviation is zero
2: In cor(predicteurs[, i], predicteurs[, 2]) :
the standard deviation is zero
Alguém pode me ajudar?