agrupación de conjuntos de datos muy grandes en R

Tengo un conjunto de datos que consta de 70,000 valores numéricos que representan distancias que van desde 0 hasta 50, y quiero agrupar estos números; sin embargo, si estoy probando el enfoque de agrupamiento clásico, entonces tendría que establecer una matriz de distancia de 70,000X70,000 que represente las distancias entre cada dos números en mi conjunto de datos, que no cabe en la memoria, por lo que me preguntaba si ¿Hay alguna forma inteligente de resolver este problema sin la necesidad de hacer un muestreo estratificado? También probé las bibliotecas bigmemory y big analytics en R pero aún no puedo guardar los datos en la memoria

Respuestas a la pregunta(3)

Su respuesta a la pregunta