Как выполнить кластеризацию k-средних в mahout с векторными данными, хранящимися как CSV?
У меня есть файл, содержащий векторы данных, где каждая строка содержит разделенный запятыми список значений. Мне интересно, как выполнить кластеризацию k-средних на этих данных, используя mahout. В примере, представленном в вики, упоминается создание sequenceFiles, но в остальном я не уверен, нужно ли мне выполнять какой-либо тип преобразования для получения этих sequenceFiles.