Vectorización en Apache Mahout

Soy nuevo en Mahout. Tengo el requisito de convertir un archivo de texto a un vector para clasificarlo en una etapa posterior.

¿Alguien de podría arrojar algo de luz sobre estas preguntas a continuación?

¿Cómo convertir un archivo de texto a un vector en mahout? El formato del archivo es como "nombre de usuario | comentario sobre artículo | calificación"Los datos serán pocos TBs. Entonces, ¿qué algoritmo implementable puedo usar para la clasificación utilizando el vector que supongo que debo crear?

Gracias arun

Respuestas a la pregunta(1)

Su respuesta a la pregunta