Zylinder-Clustering im R-Clustering-Zeitstempel mit anderen Daten
Ich lerne R und muss numerische Daten mit einem Zeitstempelfeld gruppieren. Einer der Parameter ist eine Zeit, und da die Daten streng von Tag zu Nacht abhängen, möchte ich die "sphärische" Natur dieser Daten berücksichtigen.
Soweit ich aus dem Handbuch ersehen habe, sind Bibliotheken wieSkmeans Ich kann keine "zylindrischen" Daten verarbeiten, sondern nur "sphärische" Daten (d. h. alle Komponenten sind in Polarkoordinaten).
Meine Idee für eine geeignete Lösung lautet wie folgt: Ich kann die HOUR-Spalte (0-24) in zwei verschiedene Spalten X, Y zerlegen und die Zeit in Polarkoordinaten ausdrücken, z. B. x ^ 2 + y ^ 2 = 1. Auf diese Weise sollte ein k-Mittelwert mit euklidischem Abstand keine Probleme bei der Interpretation der Daten haben.
Habe ich recht?