Результаты поиска по запросу "mahout"
В чем разница между основанной на элементах и основанной на контенте совместной фильтрацией?
Я озадачен тем, что является рекомендацией на основе предметов, как описано в книге "Mahout в действии [https://www.manning.com/books/mahout-in-action]". В книге есть алгоритм: for every item i that u has no preference for yet for every item j ...
Mahout строкаСходство
Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в форматеKey class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable, Я следую за быстрым туром анализа текста ...
Как устранить ошибку загрузки основного класса MahoutDriver на примере классификации двадцати групп новостей
Я пытаюсь запустить пример классификации 2newsgroup в Mahout. Я установил MAHOUT_LOCAL = true, классификатор не отображает матрицу путаницы и выдает следующи...
Mahout: скорректированное сходство косинусов для рекомендателя на основе предметов
Для задания я должен протестировать различные типы рекомендаций, которые я должен реализовать в первую очередь. Я искал хорошую библиотеку для этого (сначала...
Кластеризация - разреженный вектор и плотный вектор
Для кластеризации входные данные Mahout должны быть в векторной форме. Есть два типа векторных реализаций. Одним из них является Sparse Vector, а другим - Dense Vector. В чем разница между двумя? Сценарии использования для разреженных и плотных?
http://shop.oreilly.com/product/0636920028536.do
астоящее время очень случайный пользовательАпач Махоут [http://mahout.apache.org/]и я подумываю о покупке книгиMahout в действии [http://www.manning.com/owen/], К сожалению, мне очень трудно понять, насколько стоит эта книга - и вижу, как ...
Проверьте это!
анный на Java Mahout's [http://mahout.apache.org/]Целью является создание масштабируемых библиотек машинного обучения. Есть ли в Python эквивалентные библиотеки?
Пожалуйста, прочитайте вопрос. ОП уже использовал кластерный дампер.
устил кластеризационный тест на просканированных страницах (более 25 тыс. Документов; набор личных данных). Я сделал кластерный дамп: $MAHOUT_HOME/bin/mahout clusterdump --seqFileDir output/clusters-1/ --output clusteranalyze.txtВывод после ...
С этим подходом вы можете оценить, какая часть вашей памяти обработки исчерпана и где вам нужно увеличить.
ускаю NaiveBayes на множестве твитов, используя Mahout. Два файла, один 100 МБ и один 300 МБ. Я изменил JAVA_HEAP_MAX на JAVA_HEAP_MAX = -Xmx2000m (ранее это было 1000). Но даже тогда mahout работал в течение нескольких часов (2, если быть ...