Расчет получения информации для текстового файла?

Question

Jan 11, 2014, 02:05 PM

data-mining java information-retrieval text-mining

Расчет получения информации для текстового файла?

я работаю над "категоризация текста с использованием функции получения информации, PCA и генетического алгоритма » Но после выполненияпредварительная обработка(Стеблинг, удаление стоп-слов, TFIDF) на документе, я не понимал, как двигаться дальше для получения информации.

мойиз файла содержатьслово и тамTFIDF значение.

лайкWORD - TFIDF VALUE

вместе (слово) - 0,235 (значение tfidf)

приходят (слово) - 0,2548 (значение tfidf)

при использовании weka для получения информации ("InfoGainAttributeEval.java») это требует.arff Формат файла в качестве ввода.

Есть ли для конвертациитекст подать в.arff формат. или любой другой способ получения информации, кроме weka?

Есть ли другой открытый исходный код для расчета получения информации для документа?

Расчет получения информации для текстового файла?

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Расчет получения информации для текстового файла?

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы