R, проблема с иерархической кластеризацией после анализа множественных соответствий

Я хочу кластеризовать набор данных (600000 наблюдений), и для каждого кластера я хочу получить главные компоненты. Мои векторы состоят из одного электронного письма и 30 качественных переменных. Каждая количественная переменная имеет 4 класса: 0,1,2 и 3.

Итак, первое, что я делаю, это загружаю библиотеку FactoMineR и загружаю мои данные:

library(FactoMineR)
mydata = read.csv("/home/tom/Desktop/ACM/acm.csv")

Затем я устанавливаю свои переменные как качественные (хотя я исключаю переменную 'email'):

for(n in 1:length(mydata)){mydata[[n]] <- factor(mydata[[n]])}

Я удаляю электронные письма из моих векторов:

mydata2 = mydata[2:31]

И я управляю MCA в этом новом наборе данных:

mca.res <- MCA(mydata2)

Теперь я хочу кластеризовать мой набор данных с помощью функции hcpc:

res.hcpc <- HCPC(mca.res)

Но я получил следующее сообщение об ошибке:

Error: cannot allocate vector of size 1296.0 Gb

Что ты думаешь я должен сделать? Мой набор данных слишком большой? Хорошо ли я использую функцию hcpc?

Ответы на вопрос(2)

Ваш ответ на вопрос