Результаты поиска по запросу "mahout"

3 ответа

Hadoop 2.2.0 совместим с Mahout 0.8?

2 ответа

В чем разница между основанной на элементах и основанной на контенте совместной фильтрацией?

Я озадачен тем, что является рекомендацией на основе предметов, как описано в книге "Mahout в действии [https://www.manning.com/books/mahout-in-action]". В книге есть алгоритм: for every item i that u has no preference for yet for every item j ...

1 ответ

Mahout строкаСходство

Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в форматеKey class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable, Я следую за быстрым туром анализа текста ...

ТОП публикаций

1 ответ

Как устранить ошибку загрузки основного класса MahoutDriver на примере классификации двадцати групп новостей

Я пытаюсь запустить пример классификации 2newsgroup в Mahout. Я установил MAHOUT_LOCAL = true, классификатор не отображает матрицу путаницы и выдает следующи...

1 ответ

Mahout: скорректированное сходство косинусов для рекомендателя на основе предметов

Для задания я должен протестировать различные типы рекомендаций, которые я должен реализовать в первую очередь. Я искал хорошую библиотеку для этого (сначала...

1 ответ

Кластеризация - разреженный вектор и плотный вектор

Для кластеризации входные данные Mahout должны быть в векторной форме. Есть два типа векторных реализаций. Одним из них является Sparse Vector, а другим - Dense Vector. В чем разница между двумя? Сценарии использования для разреженных и плотных?

1 ответ

http://shop.oreilly.com/product/0636920028536.do

астоящее время очень случайный пользовательАпач Махоут [http://mahout.apache.org/]и я подумываю о покупке книгиMahout в действии [http://www.manning.com/owen/], К сожалению, мне очень трудно понять, насколько стоит эта книга - и вижу, как ...

5 ответов

Проверьте это!

анный на Java Mahout's [http://mahout.apache.org/]Целью является создание масштабируемых библиотек машинного обучения. Есть ли в Python эквивалентные библиотеки?

4 ответа

Пожалуйста, прочитайте вопрос. ОП уже использовал кластерный дампер.

устил кластеризационный тест на просканированных страницах (более 25 тыс. Документов; набор личных данных). Я сделал кластерный дамп: $MAHOUT_HOME/bin/mahout clusterdump --seqFileDir output/clusters-1/ --output clusteranalyze.txtВывод после ...

3 ответа

С этим подходом вы можете оценить, какая часть вашей памяти обработки исчерпана и где вам нужно увеличить.

ускаю NaiveBayes на множестве твитов, используя Mahout. Два файла, один 100 МБ и один 300 МБ. Я изменил JAVA_HEAP_MAX на JAVA_HEAP_MAX = -Xmx2000m (ранее это было 1000). Но даже тогда mahout работал в течение нескольких часов (2, если быть ...