Результаты поиска по запросу "mahout"

2 ответа

Как выполнить кластеризацию k-средних в mahout с векторными данными, хранящимися как CSV?

У меня есть файл, содержащий векторы данных, где каждая строка содержит разделенный запятыми список значений. Мне интересно, как выполнить кластеризацию k-средних на этих данных, используя mahout. В примере, представленном в вики, упоминается ...

2 ответа

Почему нормализация вектора может повысить точность кластеризации и классификации?

В Mahout in Action описано, что нормализация может немного повысить точность. Может кто-нибудь объяснить причину, спасибо!

2 ответа

В чем разница между основанной на элементах и основанной на контенте совместной фильтрацией?

Я озадачен тем, что является рекомендацией на основе предметов, как описано в книге "Mahout в действии [https://www.manning.com/books/mahout-in-action]". В книге есть алгоритм: for every item i that u has no preference for yet for every item j ...

ТОП публикаций

1 ответ

Кластеризация - разреженный вектор и плотный вектор

Для кластеризации входные данные Mahout должны быть в векторной форме. Есть два типа векторных реализаций. Одним из них является Sparse Vector, а другим - Dense Vector. В чем разница между двумя? Сценарии использования для разреженных и плотных?

1 ответ

Mahout строкаСходство

Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в форматеKey class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable, Я следую за быстрым туром анализа текста ...

1 ответ

Как работает оценщик рекомендаций mahout

Кто-нибудь может сказать мне, как работает РекомендаторIRStatsEvaluator от mahout? Более конкретно, как это случайным образом разделяет данные обучения и тестирования и с какими данными сравнивается результат? Исходя из моего занижения, вам нужен ...

3 ответа

Hadoop 2.2.0 совместим с Mahout 0.8?

У меня есть версия 2.2.0 кластера hadoop с mahout 0.8, это совместимо? Потому что всякий раз, когда я запускаю эту команду: bin/mahout recommenditembased --input mydata.dat --usersFile user.dat --numRecommendations 2 --output output/ ...