Результаты поиска по запросу "mahout"
Кластеризация - разреженный вектор и плотный вектор
Для кластеризации входные данные Mahout должны быть в векторной форме. Есть два типа векторных реализаций. Одним из них является Sparse Vector, а другим - Dense Vector. В чем разница между двумя? Сценарии использования для разреженных и плотных?
Mahout строкаСходство
Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в форматеKey class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable, Я следую за быстрым туром анализа текста ...
Как работает оценщик рекомендаций mahout
Кто-нибудь может сказать мне, как работает РекомендаторIRStatsEvaluator от mahout? Более конкретно, как это случайным образом разделяет данные обучения и тестирования и с какими данными сравнивается результат? Исходя из моего занижения, вам нужен ...
Почему нормализация вектора может повысить точность кластеризации и классификации?
В Mahout in Action описано, что нормализация может немного повысить точность. Может кто-нибудь объяснить причину, спасибо!
В чем разница между основанной на элементах и основанной на контенте совместной фильтрацией?
Я озадачен тем, что является рекомендацией на основе предметов, как описано в книге "Махут в действии ", В книге есть алгоритм:
Можно ли использовать Apache Mahout без зависимости Hadoop?
Можно ли использовать Apache mahout без какой-либо зависимости от Hadoop. Я хотел бы использовать алгоритм mahout на одном компьютере, включив только библиотеку mahout в свой проект Java, но я вообще не хочу использовать hadoop, так как я все ...
Полное использование всех ядер в псевдораспределенном режиме Hadoop
Я запускаю задачу в псевдораспределенном режиме на своем 4-ядерном ноутбуке. Как я могу обеспечить эффективное использование всех ядер? В настоящее время мой трекер работы показывает, что одновременно выполняется только одна работа. Означает ли ...
Как выполнить кластеризацию k-средних в mahout с векторными данными, хранящимися как CSV?
У меня есть файл, содержащий векторы данных, где каждая строка содержит разделенный запятыми список значений. Мне интересно, как выполнить кластеризацию k-средних на этих данных, используя mahout. В примере, представленном в вики, упоминается ...
Почему нормализация вектора может повысить точность кластеризации и классификации?
В Mahout in Action описано, что нормализация может немного повысить точность. Может кто-нибудь объяснить причину, спасибо!
В чем разница между основанной на элементах и основанной на контенте совместной фильтрацией?
Я озадачен тем, что является рекомендацией на основе предметов, как описано в книге "Mahout в действии [https://www.manning.com/books/mahout-in-action]". В книге есть алгоритм: for every item i that u has no preference for yet for every item j ...