Четвертая цитата выше посвящена, прежде всего, вопросу, который вы добавили в свое редактирование - как решить, когда объединять кластеры, а не создавать «суперкластер», который охватывает оба.
у исследовать отношения между элементами данных в большом массиве. Каждый элемент данных представлен многомерным вектором. Прежде всего, я решил использовать кластеризацию. Я заинтересован в поиске иерархических отношений между кластерами (группами векторов данных). Я могу рассчитать расстояние между моими векторами. Итак, на первом этапе я нахожуминимальное остовное дерево, После этого мне нужно сгруппировать векторы данных по ссылкам в моем связующем дереве. Но на этом этапе я обеспокоен -Как объединить разные векторы в иерархические кластеры? Я использую эвристику:если два вектора связаны, а расстояние между ними очень мало - это означает, что они находятся в одном кластере, если два вектора связаны, но расстояние между ними больше порога - это означает, что они находятся в разных кластерах с общим корневым кластером.
Но, может быть, есть лучшее решение?
Спасибо
Постскриптум Спасибо всем!
На самом деле я пытался использовать k-means и некоторые варианты CLOPE, но не получил хороших результатов.
Итак, теперь я знаю, что кластеры моего набора данных на самом деле имеют сложную структуру (гораздо более сложную, чем n-сферы).
Вот почему я хочу использовать иерархическую кластеризацию. ТакжеЯ предполагаю, что кластеры выглядят как конкатенации n-измерения (например, 3D или 2D цепи). Так что я используюодноканального стратегия. Но меня беспокоит - как объединить разные кластеры друг с другом (в какой ситуации я должен создать общий корневой кластер, и в каких ситуациях мне нужно объединить все подкластеры в один кластер?). Я использую такую простую стратегию:
Если кластеры (или векторы) находятся слишком близко друг к другу - я объединяю их содержимое в один кластер (регулируется порогом)Если кластеры (или векторы) находятся слишком далеко друг от друга - я создаю корневой кластер и помещаю их в негоНо используя эту стратегию, я получилочень большие скопления деревьев, Я пытаюсь найти удовлетворительный порог. Но, может быть, может быть лучшая стратегия для создания дерева кластеров?
Вот простая картинка, описывает мой вопрос: