¿Alguna forma de aumentar la velocidad de inicio de JVM?
Se dice que Java es 10 veces más rápido que Python en términos de rendimiento. Eso es lo que veo también en los puntos de referencia. Pero lo que realmente derriba a Java es el tiempo de inicio de JVM.
Esta es una prueba que hice:
$time xlsx2csv.py Types\ of\ ESI\ v2.doc-emb-Package-9
...
<output skipped>
real 0m0.085s
user 0m0.072s
sys 0m0.013s
$time java -jar -client /usr/local/bin/tika-app-0.7.jar -m Types\ of\ ESI\ v2.doc-emb-Package-9
real 0m2.055s
user 0m2.433s
sys 0m0.078s
¡El mismo archivo, un archivo incrustado XLSX de 12 KB ms dentro de Docx y Python es 25 veces más rápido! WTH !!
Se necesitan 2.055 segundos para Java.
Sé que todo se debe al tiempo de inicio, pero lo que necesito es llamarlo a través de un script para analizar algunos documentos que no quiero reinventar la rueda en Python.
Pero en cuanto a analizar archivos de 10k +, simplemente no es práctico.
De todos modos para acelerarlo (ya probé la opción -client y solo se aceleró tan poco (20%)).
Mi otra idea? ¿Ejecutarlo como un demonio de larga ejecución, comunicarse utilizando sockets UDP o Linux-ICP localmente?