Clustering cilíndrico em R - registro de data e hora do clustering com outros dados
Estou aprendendo R e tenho que agrupar dados numéricos com um campo de carimbo de data / hora. Um dos parâmetros é o horário e, como os dados dependem estritamente do dia e da noite, quero levar em consideração a natureza "esférica" desses dados.
Tanto quanto vi no manual, bibliotecas comoskmeans não pode manipular dados "cilíndricos", mas apenas dados "esféricos" (ou seja, onde todos os componentes estão em coordenadas polares).
Minha idéia para uma solução adequada é a seguinte: Posso decompor a coluna HOUR (0-24) em duas colunas diferentes X, Y e expressar o tempo em coordenadas polares, como x ^ 2 + y ^ 2 = 1. Desta forma, um k-significa com distância euclidiana não deve ter problemas para interpretar os dados.
Estou certo?