Resultados da pesquisa a pedido "data-mining"
Misturando dados categorial e contínuos no classificador Naive Bayes usando scikit-learn
Estou usando o scikit-learn em Python para desenvolver um algoritmo de classificação para prever o gênero de determinados clientes. Entre outros, eu quero us...
Como agrupar locais próximos de latitude e longitude armazenados em SQL
Estou tentando analisar dados de acidentes de ciclo no Reino Unido para encontrar pontos negros estatísticos. Aqui está o exemplo dos dados de outro site.htt...
k significa algoritmo de clustering
Eu quero executar uma análise de clustering k significa em um conjunto de 10 pontos de dados que cada um tem uma matriz de 4 valores numéricos associados a e...
Como selecionar os 100 principais recursos (um subconjunto) que são mais relevantes após o pca?
Realizei PCA em uma matriz 63 * 2308 e obtive uma pontuação e uma matriz coeficiente. A matriz de pontuação é 63 * 2308 e a matriz coeficiente é 2308 * 2308 ...
No scikit-learn, o DBSCAN pode usar matriz esparsa?
Eu tenho erro de memória quando eu estava executando o algoritmo dbscan do scikit. Meus dados são cerca de 20000 * 10000, é uma matriz binária.(Talvez não se...
Escrevendo regras geradas por Apriori
Estou trabalhando com alguns dados de transações grandes. Eu tenho usado read.transactions e apriori (partes do pacote arules) para meus para emparelhamento ...
como determinar o número de tópicos para o LDA?
Eu sou um calouro na LDA e quero usá-lo no meu trabalho. No entanto, alguns problemas aparecem.Para obter o melhor desempenho, quero estimar o melhor número ...
Alguém pode dar um exemplo de semelhança de cosseno, de uma forma muito simples e gráfica?
Artigo de semelhança de cosseno na WikipediaVocê pode mostrar os vetores aqui (em uma lista ou algo assim) e depois fazer as contas, e vamos ver como isso fu...