Resultados de la búsqueda a petición "mahout"
¿Cómo puedo usar el código API del archivo de secuencia de Mahout?
Existe en Mahout un comando para crear un archivo de secuencia como
¿Cómo realizar la agrupación de k-means en mahout con datos vectoriales almacenados como CSV?
Tengo un archivo que contiene vectores de datos, donde cada fila contiene una lista de valores separados por comas. Me pregunto cómo realizar k-means clustering en estos datos usando mahout. El ejemplo proporcionado en el wiki menciona la ...
Candidate Strategy for GenericUserBasedRecommender in Mahout
En Mahout puedes definir unCandidateItemsStrategy paraGenericItemBasedRecommender tal que elementos específicos, p. de cierta categoría están excluidos. Cuando se usa unaGenericUserBasedRecommender esto no es posible. ¿Cómo puedo lograr esto ...
Utilización completa de todos los núcleos en modo pseudodistribuido de Hadoop
Estoy ejecutando una tarea en modo pseudodistribuido en mi computadora portátil de 4 núcleos. ¿Cómo puedo asegurarme de que todos los núcleos se utilizan de manera efectiva? Actualmente, mi rastreador de trabajos muestra que solo se ...
es posible usar apache mahout sin dependencia de hadoop?
¿Es posible usar Apache mahout sin ninguna dependencia de Hadoop? Me gustaría usar el algoritmo mahout en una sola computadora al incluir solo la biblioteca mahout dentro de mi proyecto Java, pero no quiero usar hadoop en absoluto, ya que de ...
K-significa con matriz muy grande
Tengo que realizar una agrupación de k-means en una matriz realmente enorme (aproximadamente 300,000x100,000 valores que es más de 100Gb). Quiero saber si puedo usar el software R para realizar esto o weka. Mi computadora es un multiprocesador ...
Mahout se queda sin espacio de almacenamiento dinámico
Estoy ejecutando NaiveBayes en un conjunto de tweets usando Mahout. Dos archivos, uno de 100 MB y otro de 300 MB. Cambié JAVA_HEAP_MAX a JAVA_HEAP_MAX = -Xmx2000m (antes era 1000). Pero incluso entonces, mahout se ejecutó durante unas horas (2 ...
Interpretación de salida de mahout clusterdumper
Realicé una prueba de agrupamiento en páginas rastreadas (más de 25,000 documentos; conjunto de datos personales). He hecho un clusterdump: $MAHOUT_HOME/bin/mahout clusterdump --seqFileDir output/clusters-1/ --output clusteranalyze.txt La ...