Результаты поиска по запросу "mahout"

1 ответ

Кластеризация - разреженный вектор и плотный вектор

Для кластеризации входные данные Mahout должны быть в векторной форме. Есть два типа векторных реализаций. Одним из них является Sparse Vector, а другим - Dense Vector. В чем разница между двумя? Сценарии использования для разреженных и плотных?

1 ответ

Mahout строкаСходство

Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в форматеKey class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable, Я следую за быстрым туром анализа текста ...

1 ответ

Как работает оценщик рекомендаций mahout

Кто-нибудь может сказать мне, как работает РекомендаторIRStatsEvaluator от mahout? Более конкретно, как это случайным образом разделяет данные обучения и тестирования и с какими данными сравнивается результат? Исходя из моего занижения, вам нужен ...

ТОП публикаций

2 ответа

Почему нормализация вектора может повысить точность кластеризации и классификации?

В Mahout in Action описано, что нормализация может немного повысить точность. Может кто-нибудь объяснить причину, спасибо!

2 ответа

В чем разница между основанной на элементах и основанной на контенте совместной фильтрацией?

Я озадачен тем, что является рекомендацией на основе предметов, как описано в книге "Махут в действии ", В книге есть алгоритм:

2 ответа

Можно ли использовать Apache Mahout без зависимости Hadoop?

Можно ли использовать Apache mahout без какой-либо зависимости от Hadoop. Я хотел бы использовать алгоритм mahout на одном компьютере, включив только библиотеку mahout в свой проект Java, но я вообще не хочу использовать hadoop, так как я все ...

2 ответа

Полное использование всех ядер в псевдораспределенном режиме Hadoop

Я запускаю задачу в псевдораспределенном режиме на своем 4-ядерном ноутбуке. Как я могу обеспечить эффективное использование всех ядер? В настоящее время мой трекер работы показывает, что одновременно выполняется только одна работа. Означает ли ...

2 ответа

Как выполнить кластеризацию k-средних в mahout с векторными данными, хранящимися как CSV?

У меня есть файл, содержащий векторы данных, где каждая строка содержит разделенный запятыми список значений. Мне интересно, как выполнить кластеризацию k-средних на этих данных, используя mahout. В примере, представленном в вики, упоминается ...

2 ответа

Почему нормализация вектора может повысить точность кластеризации и классификации?

В Mahout in Action описано, что нормализация может немного повысить точность. Может кто-нибудь объяснить причину, спасибо!

2 ответа

В чем разница между основанной на элементах и основанной на контенте совместной фильтрацией?

Я озадачен тем, что является рекомендацией на основе предметов, как описано в книге "Mahout в действии [https://www.manning.com/books/mahout-in-action]". В книге есть алгоритм: for every item i that u has no preference for yet for every item j ...