Результаты поиска по запросу "document-classification"

3 ответа

Подавление вывода в libsvm (python)

Я использую libsvm (svmutils) из python для задачи классификации. Классификатор точен. Тем не менее, я получаю вывод, как это: * optimization finished, #iter = 75 nu = 0.000021 obj = -0.024330, rho = 0.563710 nSV = 26, nBSV = 0 Total nSV = 26 * ...

1 ответ

Получить доменное имя WordNet для указанного слова

Я знаю, что WordNet имеет иерархию доменов: например, Спорт> футбол. 1) Можно ли перечислить все слова, относящиеся, например, к субдомену «спорт-> футбол»? Response: goalkeeper, forward, penalty, ball, field, stadium, referee and so on. 2) ...

0 ответов

Сбой DocumentTermMatrix со странной ошибкой только тогда, когда # term> 3000

Мой код ниже работает нормально, если я не использую создать DocumentTermMatrix с более чем 3000 терминов. Эта строка: movie_dict <- findFreqTerms(movie_dtm_train, 8) movie_dtm_hiFq_train <- DocumentTermMatrix(movie_corpus_train, list(dictionary ...

ТОП публикаций

1 ответ

Пример для Стэнфордского классификатора НЛП

Я пытаюсь выучить Стэнфордский классификатор НЛП и хотел бы заняться проблемой классификации документов. Может кто-нибудь предложить место, где я могу найти ...

1 ответ

Получить доменное имя WordNet для указанного слова

Я знаю, что WordNet имеет иерархию доменов: например, Спорт&gt;футбол.1) Можно ли перечислить все слова, связанные, например, сСпорт&gt;футбол&#39; суб-домен?

1 ответ

Как вы инициализируете переменную gensim corpus с помощью csr_matrix?

У меня есть X в качестве csr_matrix, который я получил с помощью векторизатора tfidf от scikit, а y - массив Мой план состоит в том, чтобы создавать функции с использованием LDA, однако мне не удалось найти, как инициализировать переменную ...

3 ответа

Как рассчитать TF * IDF для одного нового документа для классификации?

Я использую векторы термина документа, чтобы представить коллекцию документа. я используюTF * IDF рассчитать вес термина для каждого вектора документа. Тогда...

1 ответ

Как вы инициализируете переменную gensim corpus с помощью csr_matrix?

У меня есть X в качестве csr_matrix, который я получил с помощью scikit &#39;s tfidf vectorizer, а y - массивЯ планирую создавать функции с использованием LD...

5 ответов

Какие проверенные и действительные алгоритмы для предложения связанных статей существуют?

3 ответа

Классификация документов по нескольким меткам

У меня есть база данных, в которой я храню данные, основанные на следующих трех полях: идентификатор, текст, {метки}. Обратите внимание, что каждый текст был назначен более чем одной метке \ tag \ class. Я хочу построить модель (weka \ rapidminer ...