R, проблема с иерархической кластеризацией после анализа множественных соответствий
Я хочу кластеризовать набор данных (600000 наблюдений), и для каждого кластера я хочу получить главные компоненты. Мои векторы состоят из одного электронного письма и 30 качественных переменных. Каждая количественная переменная имеет 4 класса: 0,1,2 и 3.
Итак, первое, что я делаю, это загружаю библиотеку FactoMineR и загружаю мои данные:
library(FactoMineR)
mydata = read.csv("/home/tom/Desktop/ACM/acm.csv")
Затем я устанавливаю свои переменные как качественные (хотя я исключаю переменную 'email'):
for(n in 1:length(mydata)){mydata[[n]] <- factor(mydata[[n]])}
Я удаляю электронные письма из моих векторов:
mydata2 = mydata[2:31]
И я управляю MCA в этом новом наборе данных:
mca.res <- MCA(mydata2)
Теперь я хочу кластеризовать мой набор данных с помощью функции hcpc:
res.hcpc <- HCPC(mca.res)
Но я получил следующее сообщение об ошибке:
Error: cannot allocate vector of size 1296.0 Gb
Что ты думаешь я должен сделать? Мой набор данных слишком большой? Хорошо ли я использую функцию hcpc?