Suchergebnisse für Anfrage "document-classification"

3 die antwort

Wie berechnet man TF * IDF für ein einzelnes neues Dokument, das klassifiziert werden soll?

Ich verwende Dokumenttermvektoren, um eine Sammlung von Dokumenten darzustellen. ich benutzeTF * IDF [http://en.wikipedia.org/wiki/Tf%E2%80%93idf]um das Termgewicht für jeden Dokumentvektor zu berechnen. Dann könnte ich diese Matrix verwenden, um ...

2 die antwort

eispiel für Stanford NLP Classifi

Ich versuche, den Stanford NLP-Klassifikator zu erlernen und möchte mich mit dem Problem der Dokumentenklassifizierung befassen. Kann jemand einen Ort vorschlagen, an dem ich ein funktionierendes Beispiel finden kann? Ich habe mir auch die Open ...

0 die antwort

DocumentTermMatrix schlägt nur dann mit einem seltsamen Fehler fehl, wenn # terms> 3000

Der folgende Code funktioniert einwandfrei, es sei denn, ich erstelle eine DocumentTermMatrix mit mehr als 3000 Begriffen. Diese Linie: movie_dict <- findFreqTerms(movie_dtm_train, 8) movie_dtm_hiFq_train ...

TOP-Veröffentlichungen

1 die antwort

Ruft den Domänennamen von WordNet für das angegebene Wort ab

Ich weiß, dass WordNet Domänenhierarchie hat: z. Sport-&gt; Fußball.1) Können alle Wörter aufgelistet werden, die sich zum Beispiel auf die Unterdomäne &quot...

1 die antwort

Wie initialisiert man eine Gensim-Corpus-Variable mit einer csr_matrix?

Ich habe X als csr_matrix, die ich mit scikits tfidf vectorizer erhalten habe, und y, das ein Array istMein Plan ist es, Features mit LDA zu erstellen. Ich k...