Limite el tamaño de los lotes de Kafka cuando use Spark Streaming

¿Es posible limitar el tamaño de los lotes devueltos por el consumidor de Kafka para Spark Streaming?

Lo pregunto porque el primer lote que obtengo tiene cientos de millones de registros y lleva años procesarlos y revisarlos.