Работа с пропущенными значениями для расчета корреляций
У меня огромная матрица с большим количеством пропущенных значений. Я хочу получить корреляцию между переменными.
1. Это решение
cor(na.omit(matrix))
лучше чем ниже?
cor(matrix, use = "pairwise.complete.obs")
Я уже выбрал только переменные, имеющие более 20% пропущенных значений.
2. Какой лучший метод имеет смысл?