Resultados da pesquisa a pedido "data-mining"

3 a resposta

Como o cluster (especialmente o cluster de strings) funcion

Ouvi falar em cluster para agrupar dados semelhantes. Quero saber como funciona no caso específico de String. Tenho uma tabela com mais de 100.000 palavras diferente Quero identificar a mesma palavra com algumas diferenças (por ...

5 a resposta

lgoritmo de cluster com atributos discretos e contínuo

Alguém conhece um bom algoritmo para executar clustering em atributos discretos e contínuos? Estou trabalhando em um problema de identificação de um grupo de clientes semelhantes e cada cliente possui atributos discretos e contínuos (pense no ...

14 a resposta

omo encontrar frases de 2 e 3 palavras usando o pacote R

Estou tentando encontrar um código que realmente funcione para encontrar as frases de duas e três palavras mais usadas no pacote de mineração de texto R (talvez exista outro pacote que eu não conheça). Eu tenho tentado usar o tokenizer, mas ...

4 a resposta

Como criar uma nova tabela de dados em Orange?

Estou usando Orange (em Python) para algumas tarefas de mineração de dados. Mais especificamente, para clustering. Embora eu tenha percorrido o tutorial e lido a maior parte da documentação, ainda tenho um problema. Todos os exemplos ...

4 a resposta

Quickminer pode extrair xpaths de uma lista de URLS, em vez de primeiro salvar as páginas HTM

Descobri o RapidMiner recentemente e estou muito empolgado com suas capacidades. No entanto, ainda não tenho certeza se o programa pode me ajudar com minhas necessidades específicas. Quero que o programa raspe correspondências xpath de uma lista ...

6 a resposta

Weka GUI - Memória insuficiente, não carrega?

Esta mesma instalação do Weka foi carregada para mim no passado. Estou simplesmente tentando carregar a GUI Weka (clique duas vezes no ícone) e recebo o seguinte erro. Como posso corrigi-lo? OutOfMemory Not enough memory. Please load a smaller ...

4 a resposta

Como os HMMs podem ser usados para reconhecimento de manuscrito?

O problema é um pouco diferente do reconhecimento tradicional de manuscrito. Eu tenho um conjunto de dados que é milhares dos seguintes. Para um personagem desenhado, tenho vários @ sequencia(x, y) coordena onde a caneta foi pressionada. ...

6 a resposta

importância do PCA ou SVD no aprendizado de máquina

odo esse tempo (especialmente no concurso da Netflix), eu sempre me deparei com este blog (ou fórum de líderes), onde eles mencionam como a aplicação de uma simples etapa SVD nos dados os ajudou a reduzir a escassez de dados ou, em geral, ...

4 a resposta

onjunto de dados @Supermarket para o algoritmo Apriori

'Tenho que desenvolver um software destinado ao analista de negócios do supermercado "Future Stores", o software executa a Association Rule Mining em dados transitórios das transações de vendas de supermercados e prepara a política de descontos ...