Clave de partición Cassandra para datos de series temporales

Question

Mar 17, 2016, 12:06 AM

Clave de partición Cassandra para datos de series temporales

Estoy probando Cassandra como base de datos de series temporales.

Creo el modelo de datos de la siguiente manera:

CREATE KEYSPACE sm WITH replication = {
  'class': 'SimpleStrategy',
  'replication_factor': 1
};

USE sm;

CREATE TABLE newdata (timestamp timestamp,
  deviceid int, tagid int,
  decvalue decimal,
  alphavalue text,
  PRIMARY KEY (deviceid,tagid,timestamp));

En la clave primaria, configuro deviceid como la clave de partición, lo que significa que todos los datos con la misma identificación del dispositivo escribirán en un nodo (significa una máquina o una partición. Cada partición puede tener un máximo de 2 mil millones de filas) también si consulto datos dentro de En el mismo nodo, la recuperación será rápida, ¿estoy en lo cierto? Soy nuevo en Cassandra y estoy un poco confundido acerca de la clave de partición y la clave de agrupación.

La mayor parte de mi consulta será la siguiente:

seleccione la última marca de tiempo de know deviceid y tagidSeleccione el decvalor de Deviceid y Tagid conocidos y marca de tiempoSeleccione alphavalue de deviceid y tagid y marca de tiempo conocidosseleccione * de know deviceid y tagid con rango de tiemposeleccione * de deviceid conocido con rango de tiempo

Tendré alrededor de 2000 deviceid, cada deviceid tendrá 60 pares tagid / value. No estoy seguro de si será una fila amplia de deviceid, marca de tiempo, tagid / value, tagid / value ...