Wektoryzacja w Apache Mahout
Jestem nowy w Mahout. Mam wymóg przekonwertowania pliku tekstowego na wektor do klasyfikacji na późniejszym etapie.
Czy ktoś może rzucić trochę światła na poniższe pytania?
Jak przekonwertować plik tekstowy na wektor w kornecie? Format pliku jest podobny do „nazwa użytkownika | komentarz o produkcie | ocena”Dane będą miały kilka TB. Który algorytm można zaimplementować do klasyfikacji za pomocą wektora, który przypuszczam stworzyć?Dzięki, Arun