Четвертая цитата выше посвящена, прежде всего, вопросу, который вы добавили в свое редактирование - как решить, когда объединять кластеры, а не создавать «суперкластер», который охватывает оба.

у исследовать отношения между элементами данных в большом массиве. Каждый элемент данных представлен многомерным вектором. Прежде всего, я решил использовать кластеризацию. Я заинтересован в поиске иерархических отношений между кластерами (группами векторов данных). Я могу рассчитать расстояние между моими векторами. Итак, на первом этапе я нахожуминимальное остовное дерево, После этого мне нужно сгруппировать векторы данных по ссылкам в моем связующем дереве. Но на этом этапе я обеспокоен -Как объединить разные векторы в иерархические кластеры? Я использую эвристику:если два вектора связаны, а расстояние между ними очень мало - это означает, что они находятся в одном кластере, если два вектора связаны, но расстояние между ними больше порога - это означает, что они находятся в разных кластерах с общим корневым кластером.

Но, может быть, есть лучшее решение?

Спасибо

Постскриптум Спасибо всем!

На самом деле я пытался использовать k-means и некоторые варианты CLOPE, но не получил хороших результатов.

Итак, теперь я знаю, что кластеры моего набора данных на самом деле имеют сложную структуру (гораздо более сложную, чем n-сферы).

Вот почему я хочу использовать иерархическую кластеризацию. ТакжеЯ предполагаю, что кластеры выглядят как конкатенации n-измерения (например, 3D или 2D цепи). Так что я используюодноканального стратегия. Но меня беспокоит - как объединить разные кластеры друг с другом (в какой ситуации я должен создать общий корневой кластер, и в каких ситуациях мне нужно объединить все подкластеры в один кластер?). Я использую такую ​​простую стратегию:

Если кластеры (или векторы) находятся слишком близко друг к другу - я объединяю их содержимое в один кластер (регулируется порогом)Если кластеры (или векторы) находятся слишком далеко друг от друга - я создаю корневой кластер и помещаю их в него

Но используя эту стратегию, я получилочень большие скопления деревьев, Я пытаюсь найти удовлетворительный порог. Но, может быть, может быть лучшая стратегия для создания дерева кластеров?

Вот простая картинка, описывает мой вопрос:

Ответы на вопрос(2)

Ваш ответ на вопрос