Java, Weka: Como prever atributo numérico?
Eu estava tentando usar o classificador NaiveBayesUpdateable da Weka. Meus dados contêm atributos nominais e numéricos:
@relation cars
@attribute country {FR, UK, ...}
@attribute city {London, Paris, ...}
@attribute car_make {Toyota, BMW, ...}
@attribute price numeric %% car price
@attribute sales numeric %% number of cars sold
Preciso prever o número de vendas (numérico!) Com base em outros atributos.
Eu entendo que não posso usar o atributo numérico para a classificação de Bayes em Weka. Uma técnica é dividir o valor do atributo numérico em N intervalos de comprimento k e usar o atributo nominal, onde n é um nome de classe, assim: @attribute class {1,2,3, ... N}.
No entanto, o atributo numérico que preciso prever varia de 0 a 1 000 000. Criar 1.000.000 de classes não faz sentido algum. Como prever atributo numérico com Weka ou quais algoritmos procurar caso Weka não tenha ferramentas para essa tarefa?