Кластеризация 500 000 геопространственных точек в питоне

В настоящее время я сталкиваюсь с проблемой поиска способа объединения около 500 000 пар широта / долгота в python. До сих пор я пытался вычислить матрицу расстояний с помощью numpy (чтобы перейти к DBSCAN для обучения по науке), но при таком большом входе он быстро выдает ошибку памяти.

Точки хранятся в кортежах, содержащих широту, долготу и значение данных в этой точке.

Короче говоря, каков наиболее эффективный способ пространственной кластеризации большого количества пар широта / долгота в python? Для этого приложения я готов пожертвовать некоторой точностью во имя скорости.

Изменить: Количество кластеров для алгоритма, чтобы найти неизвестно заранее.

Ответы на вопрос(2)

Ваш ответ на вопрос