Cómo indexar archivos de texto usando apache solr

Quería indexar archivos de texto. Después de buscar mucho me puse a conocer sobre Apache tika. Ahora, en algunos sitios donde estudié Apache tika, pude saber que Apache tika convierte el texto en formato XML y luego lo envía a solr. Pero al convertirlo, solo se crea un ejemplo de etiqueta ... Ahora, el archivo de texto que deseo indexar es un archivo de acceso de host local Tomcat. Este archivo está en GB's. No puedo almacenarlo y un solo índice. Quiero que cada línea tenga una identificación de línea ......... para que pueda recuperar fácilmente la línea correspondiente.

¿Se puede hacer esto en Apache Tika?

Respuestas a la pregunta(2)

Su respuesta a la pregunta