Цилиндрическая кластеризация в R - метка времени кластеризации с другими данными
Я изучаю R, и я должен кластеризовать числовые данные с полем отметки времени. Одним из параметров является время, и, поскольку данные строго зависят от дня и ночи, я хочу принять во внимание «сферическую» природу этих данных.
Насколько я видел из руководства, библиотеки, такие какskmeans не может обрабатывать «цилиндрические» данные, а только «сферические» данные (т. е. когда все компоненты находятся в полярных координатах).
Моя идея подходящего решения заключается в следующем: я могу разложить столбец HOUR (0-24) на два разных столбца X, Y и выразить время в полярных координатах, таких как x ^ 2 + y ^ 2 = 1. Таким образом, k-среднее с евклидовым расстоянием не должно иметь проблем при интерпретации данных.
Я прав?