Результаты поиска по запросу "mahout"
Mahout строкаСходство
Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в формате
Почему нормализация вектора может повысить точность кластеризации и классификации?
В Mahout in Action описано, что нормализация может немного повысить точность. Может кто-нибудь объяснить причину, спасибо!
Кластеризация - разреженный вектор и плотный вектор
Для кластеризации входные данные Mahout должны быть в векторной форме. Есть два типа векторных реализаций. Одним из них является Sparse Vector, а другим - Dense Vector. В чем разница между двумя? Сценарии использования для разреженных и плотных?
Пожалуйста, прочитайте вопрос. ОП уже использовал кластерный дампер.
устил кластеризационный тест на просканированных страницах (более 25 тыс. Документов; набор личных данных). Я сделал кластерный дамп: $MAHOUT_HOME/bin/mahout clusterdump --seqFileDir output/clusters-1/ --output clusteranalyze.txtВывод после ...
Полное использование всех ядер в псевдораспределенном режиме Hadoop
Я запускаю задачу в псевдораспределенном режиме на своем 4-ядерном ноутбуке. Как я могу обеспечить эффективное использование всех ядер? В настоящее время мой трекер работы показывает, что одновременно выполняется только одна работа. Означает ли ...
В чем разница между основанной на элементах и основанной на контенте совместной фильтрацией?
Я озадачен тем, что является рекомендацией на основе предметов, как описано в книге "Mahout в действии [https://www.manning.com/books/mahout-in-action]". В книге есть алгоритм: for every item i that u has no preference for yet for every item j ...
http://shop.oreilly.com/product/0636920028536.do
астоящее время очень случайный пользовательАпач Махоут [http://mahout.apache.org/]и я подумываю о покупке книгиMahout в действии [http://www.manning.com/owen/], К сожалению, мне очень трудно понять, насколько стоит эта книга - и вижу, как ...
Преобразование CSV в SequenceFile
У меня есть файл CSV, который я хотел бы преобразовать в SequenceFile, который я в конечном итоге использовал бы для создания NamedVectors для использования ...