Изучение Века в командной строке
Я довольно новичок в Weka и еще больше новичок в Weka из командной строки. Я нахожу документацию плохой, и я изо всех сил пытаюсь выяснить несколько вещей, чтобы сделать. Например, вы хотите взять два файла .arff, один для обучения, другой для тестирования, и получить вывод прогнозов для отсутствующих меток в тестовых данных.
Как я могу это сделать?
У меня есть этот код в качестве стартового блока
java -classpath weka.jar weka.classifiers.meta.FilteredClassifier
-t "training_file_with_missing_values.arff"
-T "test_file_with_missing_values.arff"
-F weka.filters.unsupervised.attribute.ReplaceMissingValues -- -c last
-W weka.classifiers.functions.MultilayerPerceptron -- -L 0.3 -M 0.2 -H a
Запуск этого кода дает мне "Неверный вариант -c последний и я не уверен почему. Я также не собираюсь использовать MLP, поскольку NN, как правило, слишком медленный, когда у меня есть несколько тысяч функций из текстовых данных. Я знаю, как изменить его на другой классификатор (например, NB или libSVM, так что это хорошо).
Но я не уверен, как добавить несколько фильтров за один вызов, так как мне также нужно добавить фильтр StringToWordVector (и, возможно, фильтр переупорядочения, чтобы сделать класс последним, а не первым атрибутом).
И как мне заставить его выводить метки прогноза для каждого класса? А потом храните так, чтобы те в arff с исходными данными.