Escolhendo algoritmo de classificação para classificar o mix de dados nominais e numéricos?

Question

Jan 11, 2013, 10:06 AM

classification data-mining machine-learning

Escolhendo algoritmo de classificação para classificar o mix de dados nominais e numéricos?

Eu tenho um conjunto de dados de cerca de 100.000 registros sobre o padrão de compra de clientes. O conjunto de dados contém

Idade (valor contínuo de 2 a 120), mas eu também planejo categorizar em faixas etárias.Gênero (ou 0 ou 1)Endereço (pode ser apenas seis tipos ou eu também posso representar usando números de 1 a 6)Loja de preferências (pode ser de apenas 7 lojas) que é o meu problema de classe.

Então, meu problema é classificar e prever os clientes com base em idade, sexo e localização da loja de preferências. Eu tentei usar árvores ingênuas e de decisão, mas sua precisão de classificação é um pouco abaixo.

Estou pensando também em regressão logística, mas não tenho certeza sobre o valor discreto, como gênero e endereço. Mas, eu também assumi SVM com alguns truques kernal mas ainda não tentei.

Então, qual algoritmo de aprendizado de máquina você sugere para melhor precisão com esses recursos?