Chave de partição Cassandra para dados de séries temporais

Question

Mar 17, 2016, 12:06 AM

Chave de partição Cassandra para dados de séries temporais

Estou testando Cassandra como banco de dados de séries temporais.

Eu crio o modelo de dados como abaixo:

CREATE KEYSPACE sm WITH replication = {
  'class': 'SimpleStrategy',
  'replication_factor': 1
};

USE sm;

CREATE TABLE newdata (timestamp timestamp,
  deviceid int, tagid int,
  decvalue decimal,
  alphavalue text,
  PRIMARY KEY (deviceid,tagid,timestamp));

Na chave Primária, defino deviceid como a chave da partição, o que significa que todos os dados com o mesmo ID de dispositivo serão gravados em um nó (significa uma máquina ou uma partição. Cada partição pode ter no máximo 2 bilhões de linhas) também se consultar dados dentro no mesmo nó, a recuperação será rápida, estou correto? Sou novo em Cassandra e um pouco confuso sobre a chave de partição e a chave de cluster.

A maior parte da minha consulta será a seguinte:

selecione o último timestamp de know deviceid e tagidSelecionar decvalor de deviceid conhecido e tagid e timestampSelecione o valor alfanumérico do deviceid conhecido e tagid e timestampselecione * de saber deviceid e tagid com intervalo de temposelecione * do dispositivo conhecido com intervalo de tempo

Eu terei cerca de 2000 deviceid, cada deviceid terá 60 pares de tagid / value. Não tenho certeza se será uma ampla linha de deviceid, timestamp, tagid / value, tagid / value ....