Требуется ли для тестового файла в weka такое же или меньшее количество функций, что и для train?

Question

Jun 08, 2012, 12:19 PM

Требуется ли для тестового файла в weka такое же или меньшее количество функций, что и для train?

Я подготовил два разных файла .arff из двух разных наборов данных: один для тестирования, другой для обучения. Каждый из них имеет одинаковые экземпляры, но разные объекты, изменяющие размерность вектора объектов для каждого файла. Когда я сделал перекрестную проверку каждого из этих файлов, они работают отлично. Это показывает, что .arff файлы правильно подготовлены и не имеют ошибок.

Теперь, если я использую файл поезда, имеющий меньшую размерность по сравнению с тестовым файлом для оценки. Я получаю следующую ошибку.

Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 5986
at  weka.classifiers.bayes.NaiveBayesMultinomial.probOfDocGivenClass(NaiveBayesMultinomial.java:295)
at weka.classifiers.bayes.NaiveBayesMultinomial.distributionForInstance(NaiveBayesMultinomial.java:254)
at weka.classifiers.Evaluation.evaluationForSingleInstance(Evaluation.java:1657)
at weka.classifiers.Evaluation.evaluateModelOnceAndRecordPrediction(Evaluation.java:1694)
at weka.classifiers.Evaluation.evaluateModel(Evaluation.java:1574)
at TrainCrossValidateARFF.main(TrainCrossValidateARFF.java:44)

Требуется ли для тестового файла в weka такое же или меньшее количество функций, что и для train? Код для оценки

public class TrainCrossValidateARFF{
    private static DecimalFormat df = new DecimalFormat("#.##");
    public static void main(String args[]) throws Exception
    {
            if (args.length != 1 && args.length != 2) {
                    System.out.println("USAGE: CrossValidateARFF <arff_file> [<stop_words_file>]");
                    System.exit(-1);
            }
            String TrainarffFilePath = args[0];
            DataSource ds = new DataSource(TrainarffFilePath);
            Instances Train = ds.getDataSet();
            Train.setClassIndex(Train.numAttributes() - 1);

            String TestarffFilePath = args[1];
            DataSource ds1 = new DataSource(TestarffFilePath);
            Instances Test  = ds1.getDataSet();
            // setting class attribute
            Test.setClassIndex(Test.numAttributes() - 1);

            System.out.println("-----------"+TrainarffFilePath+"--------------");
            System.out.println("-----------"+TestarffFilePath+"--------------");
            NaiveBayesMultinomial naiveBayes = new NaiveBayesMultinomial();
            naiveBayes.buildClassifier(Train);

            Evaluation eval = new Evaluation(Train);
            eval.evaluateModel(naiveBayes,Test);
            System.out.println(eval.toSummaryString("\nResults\n======\n", false));
}
}

Требуется ли для тестового файла в weka такое же или меньшее количество функций, что и для train?

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Требуется ли для тестового файла в weka такое же или меньшее количество функций, что и для train?

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы