Clave de partición Cassandra para datos de series temporales
Estoy probando Cassandra como base de datos de series temporales.
Creo el modelo de datos de la siguiente manera:
CREATE KEYSPACE sm WITH replication = {
'class': 'SimpleStrategy',
'replication_factor': 1
};
USE sm;
CREATE TABLE newdata (timestamp timestamp,
deviceid int, tagid int,
decvalue decimal,
alphavalue text,
PRIMARY KEY (deviceid,tagid,timestamp));
En la clave primaria, configuro deviceid como la clave de partición, lo que significa que todos los datos con la misma identificación del dispositivo escribirán en un nodo (significa una máquina o una partición. Cada partición puede tener un máximo de 2 mil millones de filas) también si consulto datos dentro de En el mismo nodo, la recuperación será rápida, ¿estoy en lo cierto? Soy nuevo en Cassandra y estoy un poco confundido acerca de la clave de partición y la clave de agrupación.
La mayor parte de mi consulta será la siguiente:
seleccione la última marca de tiempo de know deviceid y tagidSeleccione el decvalor de Deviceid y Tagid conocidos y marca de tiempoSeleccione alphavalue de deviceid y tagid y marca de tiempo conocidosseleccione * de know deviceid y tagid con rango de tiemposeleccione * de deviceid conocido con rango de tiempoTendré alrededor de 2000 deviceid, cada deviceid tendrá 60 pares tagid / value. No estoy seguro de si será una fila amplia de deviceid, marca de tiempo, tagid / value, tagid / value ...