Detener palabras y stemmer en java

Estoy pensando en poner un stop en mi programa de similitud y luego un stemmer (ir para los porteros 1 o 2 depende de lo que sea más fácil de implementar)

e preguntaba que desde que leí mi texto de los archivos como líneas completas y los guardé como una cadena larga, entonces si tengo dos cadenas, por ejemplo.

String one = "I decided buy something from the shop.";
String two = "Nevertheless I decidedly bought something from a shop.";

Ahora que tengo esas cadenas

Stemming: ¿Puedo usar el algoritmo stemmer directamente en él, guardarlo como una cadena y luego continuar trabajando en la similitud como lo hice antes de implementar el stemmer en el programa, como ejecutar one.stem (); ¿Tipo de cosa

Palabra de detención: ¿Cómo funciona esto? O.o ¿Acabo de usar; one.replaceall ("I", ""); o hay alguna forma específica de usar para este proceso? Quiero seguir trabajando con la cadena y obtener una cadena antes de usar los algoritmos de similitud para obtener la similitud. Wiki no dice mucho.

¡Espero que me puedan ayudar! Gracias

Edit: es para un proyecto relacionado con la escuela en el que estoy escribiendo un documento sobre similitud entre diferentes algoritmos, por lo que no creo que se me permita usar lucene u otras bibliotecas que hagan el trabajo por mí. Además, me gustaría probar y entender cómo funciona antes de comenzar a usar las bibliotecas como Lucene y compañía. Espero que no sea una molestia ^^

Respuestas a la pregunta(3)

Su respuesta a la pregunta