Divisão de caçamba Cassandra para dimensionamento de partição

Sou bastante novo no Cassandra, aprendi apenas com os cursos Datastax, mas não encontro informações suficientes no bucket aqui ou na Internet e, no meu aplicativo, preciso usar buckets para dividir meus dados.

Eu tenho alguns instrumentos que farão medidas, e dividir as medidas diariamente (carimbo de data e hora como chave da partição) pode ser um pouco arriscado, pois podemos facilmente atingir o limite de 100 MB para uma partição. Cada medida refere-se a um objeto específico identificado com um ID. Então, eu gostaria de usar um balde, mas não sei como fazer.

Estou usando Cassandra 3.7

Aqui está como minha tabela será, aproximadamente:

CREATE TABLE measures (
  instrument_id bigint,
  day timestamp,
  bucket int,
  measure_timestamp timestamp,
  measure_id uuid,
  measure_info float,
  object_id bigint,
  PRIMARY KEY ((instrument_id, day, bucket), measure_timestamp, measure_id)
);

Pensei em adicionar o object_id como uma chave de partição, mas depois perco o "fluxo de medidas" feito por um instrumento, pois o que me interessa é ver todas as medidas feitas por um instrumento em um dia ou período específico.

Portanto, a pergunta é: quando eu quero solicitar todos os registros de um dia para um instrumento específico, como posso fazer se houver muitos buckets?Se eu quiser que o limite da partição seja de 400.000 linhas, como posso saber ao inserir dados em qual intervalo devo inserir os dados?Existe uma maneira de saber o número de baldes que existe?

Muito obrigado pela sua ajuda!

questionAnswers(1)

yourAnswerToTheQuestion