Resultados da pesquisa a pedido "data-mining"
Como o cluster (especialmente o cluster de strings) funcion
Ouvi falar em cluster para agrupar dados semelhantes. Quero saber como funciona no caso específico de String. Tenho uma tabela com mais de 100.000 palavras diferente Quero identificar a mesma palavra com algumas diferenças (por ...
lgoritmo de cluster com atributos discretos e contínuo
Alguém conhece um bom algoritmo para executar clustering em atributos discretos e contínuos? Estou trabalhando em um problema de identificação de um grupo de clientes semelhantes e cada cliente possui atributos discretos e contínuos (pense no ...
omo encontrar frases de 2 e 3 palavras usando o pacote R
Estou tentando encontrar um código que realmente funcione para encontrar as frases de duas e três palavras mais usadas no pacote de mineração de texto R (talvez exista outro pacote que eu não conheça). Eu tenho tentado usar o tokenizer, mas ...
Como criar uma nova tabela de dados em Orange?
Estou usando Orange (em Python) para algumas tarefas de mineração de dados. Mais especificamente, para clustering. Embora eu tenha percorrido o tutorial e lido a maior parte da documentação, ainda tenho um problema. Todos os exemplos ...
Quickminer pode extrair xpaths de uma lista de URLS, em vez de primeiro salvar as páginas HTM
Descobri o RapidMiner recentemente e estou muito empolgado com suas capacidades. No entanto, ainda não tenho certeza se o programa pode me ajudar com minhas necessidades específicas. Quero que o programa raspe correspondências xpath de uma lista ...
Weka GUI - Memória insuficiente, não carrega?
Esta mesma instalação do Weka foi carregada para mim no passado. Estou simplesmente tentando carregar a GUI Weka (clique duas vezes no ícone) e recebo o seguinte erro. Como posso corrigi-lo? OutOfMemory Not enough memory. Please load a smaller ...
Como os HMMs podem ser usados para reconhecimento de manuscrito?
O problema é um pouco diferente do reconhecimento tradicional de manuscrito. Eu tenho um conjunto de dados que é milhares dos seguintes. Para um personagem desenhado, tenho vários @ sequencia(x, y) coordena onde a caneta foi pressionada. ...
importância do PCA ou SVD no aprendizado de máquina
odo esse tempo (especialmente no concurso da Netflix), eu sempre me deparei com este blog (ou fórum de líderes), onde eles mencionam como a aplicação de uma simples etapa SVD nos dados os ajudou a reduzir a escassez de dados ou, em geral, ...
onjunto de dados @Supermarket para o algoritmo Apriori
'Tenho que desenvolver um software destinado ao analista de negócios do supermercado "Future Stores", o software executa a Association Rule Mining em dados transitórios das transações de vendas de supermercados e prepara a política de descontos ...