Cassandra cubeta de división para el tamaño de la partición

Soy bastante nuevo en Cassandra, lo acabo de aprender con los cursos Datastax, pero no encuentro suficiente información sobre el depósito aquí o en Internet y en mi aplicación necesito usar depósitos para dividir mis datos.

Tengo algunos instrumentos que harán medidas, bastante, y dividir las medidas diariamente (marca de tiempo como clave de partición) puede ser un poco arriesgado, ya que podemos alcanzar fácilmente el límite de 100 MB para una partición. Cada medida se refiere a un objeto específico identificado con una ID. Entonces me gustaría usar un cubo, pero no sé cómo hacerlo.

Estoy usando Cassandra 3.7

Así es como se verá mi mesa, más o menos:

CREATE TABLE measures (
  instrument_id bigint,
  day timestamp,
  bucket int,
  measure_timestamp timestamp,
  measure_id uuid,
  measure_info float,
  object_id bigint,
  PRIMARY KEY ((instrument_id, day, bucket), measure_timestamp, measure_id)
);

Pensé en agregar el object_id como una clave de partición, pero luego perdí el "flujo de medidas" realizado por un instrumento, ya que lo que me interesa es ver todas las medidas realizadas por un instrumento en un día o período de tiempo específico.

Entonces, la pregunta es, cuando quiero solicitar todos los registros de un día para un instrumento específico, ¿cómo puedo hacerlo si hay muchos cubos?Si quiero que el límite de partición sea de 400 000 filas, ¿cómo puedo saber al insertar datos en qué depósito tengo que insertar los datos?¿Hay alguna manera de saber la cantidad de cubos que hay?

¡Muchas gracias por su ayuda!

Respuestas a la pregunta(1)

Su respuesta a la pregunta