Wybór algorytmu klasyfikacji do klasyfikacji mieszanki danych nominalnych i numerycznych?

Question

Jan 11, 2013, 10:06 AM

machine-learning data-mining classification

Wybór algorytmu klasyfikacji do klasyfikacji mieszanki danych nominalnych i numerycznych?

Mam zbiór danych zawierający około 100 000 rekordów dotyczących wzorca zakupów klientów. Zestaw danych zawiera

Wiek (wartość ciągła od 2 do 120), ale planuję również podzielić na kategorie wiekowe.Płeć (0 lub 1)Adres (może być tylko sześć typów lub mogę również reprezentować za pomocą liczb od 1 do 6)Preferencyjny sklep (może być tylko z 7 sklepów), co jest moim problemem klasowym.

Więc moim problemem jest klasyfikacja i przewidywanie klientów na podstawie ich wieku, płci i lokalizacji w sklepie Preference. Próbowałem użyć drzew naiwnych i decyzyjnych, ale ich dokładność klasyfikacji jest nieco niższa niżej.

Myślę też o regresji logistycznej, ale nie jestem pewien co do wartości dyskretnej, takiej jak płeć i adres. Ale założyłem SVM z kilkoma sztuczkami kernal, ale jeszcze nie próbowałem.

Który algorytm uczenia maszynowego sugerujesz dla lepszej dokładności z tymi funkcjami.