¿Cómo reducir el tamaño de un índice Lucene / Solr generado?
Estoy trabajando en un prototipo de un sistema de búsqueda.
Tengo una mesa en oráculo con algunos campos. Generé datos que parecen reales. Alrededor de 300,000 filas. Por ejemplo:
PaymentNo|Datetime |AmountEuro|PayersName |PayersPhoneNo|ReceiversLegal|ReceiversAcc 2314 |2015-07-21T15:14|15.63 |Clinton, Barack Anjela|1.918.0060657|Nasa |5555569778664190000 230338 |2015-08-01T15:14|34.87 |Merkel, George Donald |1.653.0060658|PepsiCo |7777828443194736000
(en realidad hay más columnas)
El tamaño de la tabla en Oracle 62 MB (informes de Toad)
Importé la tabla en Solr 5.2.1 (en Windows). El tamaño del índice con datos es de 88 MB (en disco). El tamaño del índice sin datos es de 67 MB.
Mi pregunta es: ¿Puedo disminuir el tamaño del índice?
Estas opciones ya están probadas: disminución de la cantidad de columnas de tabla indexadas. Desactivar el almacenamiento de datos en Solr. Excluyendo alguna parte de las filas del índice.
Necesito una oportunidad extra para disminuir el tamaño de un índice. ¿Conoce alguna?