Java, Weka: Wie kann man ein numerisches Attribut vorhersagen?
Ich habe versucht, den NaiveBayesUpdateable-Klassifikator von Weka zu verwenden. Meine Daten enthalten sowohl nominelle als auch numerische Attribute:
@relation cars
@attribute country {FR, UK, ...}
@attribute city {London, Paris, ...}
@attribute car_make {Toyota, BMW, ...}
@attribute price numeric %% car price
@attribute sales numeric %% number of cars sold
Ich muss die Anzahl der Verkäufe (numerisch!) Basierend auf anderen Attributen vorhersagen.
Ich verstehe, dass ich kein numerisches Attribut für die Bayes-Klassifizierung in Weka verwenden kann. Eine Technik besteht darin, den Wert des numerischen Attributs in N Intervalle der Länge k aufzuteilen und stattdessen ein nominales Attribut zu verwenden, wobei n ein Klassenname ist, wie folgt: @attribute class {1,2,3, ... N}.
Das numerische Attribut, das ich vorhersagen muss, reicht jedoch von 0 bis 1 000 000. Das Erstellen von 1 000 000 Klassen macht überhaupt keinen Sinn. Wie kann man mit Weka numerische Attribute vorhersagen oder nach welchen Algorithmen muss man suchen, falls Weka keine Werkzeuge für diese Aufgabe hat?