Wektoryzacja w Apache Mahout

Jestem nowy w Mahout. Mam wymóg przekonwertowania pliku tekstowego na wektor do klasyfikacji na późniejszym etapie.

Czy ktoś może rzucić trochę światła na poniższe pytania?

Jak przekonwertować plik tekstowy na wektor w kornecie? Format pliku jest podobny do „nazwa użytkownika | komentarz o produkcie | ocena”Dane będą miały kilka TB. Który algorytm można zaimplementować do klasyfikacji za pomocą wektora, który przypuszczam stworzyć?

Dzięki, Arun

questionAnswers(1)

yourAnswerToTheQuestion