Результаты поиска по запросу "document-classification"
Сбой DocumentTermMatrix со странной ошибкой только тогда, когда # term> 3000
Мой код ниже работает нормально, если я не использую создать DocumentTermMatrix с более чем 3000 терминов. Эта строка: movie_dict <- findFreqTerms(movie_dtm_train, 8) movie_dtm_hiFq_train <- DocumentTermMatrix(movie_corpus_train, list(dictionary ...
Получить доменное имя WordNet для указанного слова
Я знаю, что WordNet имеет иерархию доменов: например, Спорт>футбол.1) Можно ли перечислить все слова, связанные, например, сСпорт>футбол' суб-домен?
Как вы инициализируете переменную gensim corpus с помощью csr_matrix?
У меня есть X в качестве csr_matrix, который я получил с помощью scikit 's tfidf vectorizer, а y - массивЯ планирую создавать функции с использованием LD...
Пример для Стэнфордского классификатора НЛП
Я пытаюсь выучить Стэнфордский классификатор НЛП и хотел бы заняться проблемой классификации документов. Может кто-нибудь предложить место, где я могу найти ...
Получить доменное имя WordNet для указанного слова
Я знаю, что WordNet имеет иерархию доменов: например, Спорт> футбол. 1) Можно ли перечислить все слова, относящиеся, например, к субдомену «спорт-> футбол»? Response: goalkeeper, forward, penalty, ball, field, stadium, referee and so on. 2) ...
Как вы инициализируете переменную gensim corpus с помощью csr_matrix?
У меня есть X в качестве csr_matrix, который я получил с помощью векторизатора tfidf от scikit, а y - массив Мой план состоит в том, чтобы создавать функции с использованием LDA, однако мне не удалось найти, как инициализировать переменную ...
Как рассчитать TF * IDF для одного нового документа для классификации?
Я использую векторы термина документа, чтобы представить коллекцию документа. я используюTF * IDF рассчитать вес термина для каждого вектора документа. Тогда...
Подавление вывода в libsvm (python)
Я использую libsvm (svmutils) из python для задачи классификации. Классификатор точен. Тем не менее, я получаю вывод, как это: * optimization finished, #iter = 75 nu = 0.000021 obj = -0.024330, rho = 0.563710 nSV = 26, nBSV = 0 Total nSV = 26 * ...
Классификация документов по нескольким меткам
У меня есть база данных, в которой я храню данные, основанные на следующих трех полях: идентификатор, текст, {метки}. Обратите внимание, что каждый текст был назначен более чем одной метке \ tag \ class. Я хочу построить модель (weka \ rapidminer ...