Chave de partição Cassandra para dados de séries temporais
Estou testando Cassandra como banco de dados de séries temporais.
Eu crio o modelo de dados como abaixo:
CREATE KEYSPACE sm WITH replication = {
'class': 'SimpleStrategy',
'replication_factor': 1
};
USE sm;
CREATE TABLE newdata (timestamp timestamp,
deviceid int, tagid int,
decvalue decimal,
alphavalue text,
PRIMARY KEY (deviceid,tagid,timestamp));
Na chave Primária, defino deviceid como a chave da partição, o que significa que todos os dados com o mesmo ID de dispositivo serão gravados em um nó (significa uma máquina ou uma partição. Cada partição pode ter no máximo 2 bilhões de linhas) também se consultar dados dentro no mesmo nó, a recuperação será rápida, estou correto? Sou novo em Cassandra e um pouco confuso sobre a chave de partição e a chave de cluster.
A maior parte da minha consulta será a seguinte:
selecione o último timestamp de know deviceid e tagidSelecionar decvalor de deviceid conhecido e tagid e timestampSelecione o valor alfanumérico do deviceid conhecido e tagid e timestampselecione * de saber deviceid e tagid com intervalo de temposelecione * do dispositivo conhecido com intervalo de tempoEu terei cerca de 2000 deviceid, cada deviceid terá 60 pares de tagid / value. Não tenho certeza se será uma ampla linha de deviceid, timestamp, tagid / value, tagid / value ....