Python o Java para procesamiento de texto (minería de texto, recuperación de información, procesamiento de lenguaje natural) [cerrado]

Pronto comenzaré un nuevo proyecto en el que haré muchas tareas de procesamiento de texto, como búsqueda, categorización / clasificación, agrupamiento, et

Habrá una gran cantidad de documentos que deben procesarse; probablemente millones de documentos. Después del procesamiento inicial, también debe poder actualizarse diariamente con múltiples documentos nuevos.

¿Puedo usar Python para hacer esto, o Python es demasiado lento? ¿Es mejor usar Java?

Si es posible, preferiría Python ya que eso es lo que he estado usando últimamente. Además, terminaría la parte de codificación mucho más rápido. Pero todo depende de la velocidad de Python. He usado Python para algunas tareas de procesamiento de texto a pequeña escala con solo un par de miles de documentos, pero no estoy seguro de qué tan bien se escala.

Respuestas a la pregunta(4)

Su respuesta a la pregunta