hclust () в R для больших наборов данных

Я пытаюсь реализовать иерархическую кластеризацию в R: hclust (); для этого требуется матрица расстояний, созданная dist (), но мой набор данных содержит около миллиона строк, и даже экземплярам EC2 не хватает ОЗУ. Есть ли обходной путь?

Ответы на вопрос(1)

Ваш ответ на вопрос