Suchergebnisse für Anfrage "nlp"

6 die antwort

Wie verwende ich OpenNLP, um POS-Tags in R zu erhalten?

Hier ist der R-Code: library(NLP) library(openNLP) tagPOS <- function(x, ...) { s <- as.String(x) word_token_annotator <- Maxent_Word_Token_Annotator() a2 <- Annotation(1L, "sentence", 1L, nchar(s)) a2 <- annotate(s, word_token_annotator, a2) ...

8 die antwort

Wie beschrifte ich einen Wortcluster automatisch mit Semantik?

Der Kontext ist: Ich habe bereits Wortgruppen (Phrasen), die sich aus kmeans ergeben, die auf Internet-Suchanfragen angewendet wurden, und die in den Suchmaschinenergebnissen als Distanz gebräuchliche URLs verwenden (gemeinsames Auftreten von ...

6 die antwort

Kosinus Ähnlichkeit von Vektoren unterschiedlicher Länge?

Ich versuche TF-IDF zu benutzen [https://stackoverflow.com/questions/3113428/classifying-documents-into-categories/3114191#3114191] , um Dokumente in Kategorien zu sortieren. Ich habe die tf_idf für einige Dokumente berechnet, aber jetzt, wenn ...

TOP-Veröffentlichungen

6 die antwort

Dokumente in Kategorien einteilen

Ich habe ungefähr 300.000 Dokumente in einer Postgres-Datenbank gespeichert, die mit Themenkategorien versehen sind (es gibt insgesamt ungefähr 150 Kategorien). Ich habe weitere 150.000 Dokumente, die noch keine Kategorien haben. Ich versuche, ...

2 die antwort

Hat NLTK ein Tool zum Parsen von Abhängigkeiten?

Ich erstelle eine NLP-Anwendung und benutze den Stanford Parser für die meisten meiner Parsing-Arbeiten, möchte aber Python verwenden. Bisher scheint NLTK die beste Wahl zu sein, aber ich kann nicht herausfinden, wie man grammatische ...

8 die antwort

Wie berechnet man Präzision, Rückruf, Genauigkeit und f1-Score für den Mehrklassenfall mit scikit learn?

Ich arbeite in einem Problem mit der Stimmungsanalyse. Die Daten sehen folgendermaßen aus: label instances 5 1190 4 838 3 239 1 204 2 127So sind meine Daten seit 1190 unausgeglicheninstances sind mit @ gekennzeichn5. Für die ...

4 die antwort

Wie berechne ich den kürzesten (geodätischen) Weg zwischen zwei Adjektiven in WordNet mit Python NLTK?

Die Berechnung der semantischen Ähnlichkeit zwischen zwei Synsets in WordNet kann auf einfache Weise mit verschiedenen integrierten Ähnlichkeitsmaßen erfolgen, z. B ...

2 die antwort

alle möglichen Wortform-Vervollständigungen eines (biomedizinischen) Wortstamms

Ich kenne mich mit Wortstamm und Vervollständigung aus dem TM-Paket in R aus. Ich versuche eine schnelle und schmutzige Methode zu finden, um alle Varianten eines bestimmten Wortes (innerhalb eines Korpus) zu finden. Zum Beispiel möchte ich ...

12 die antwort

NLTK Named Entity-Erkennung zu einer Python-Liste

Ich habe NLTK's @ benutne_chunk um benannte Entitäten aus einem Text zu extrahieren: my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, the top federal prosecutor in ...

6 die antwort

NLTK und Spracherkennung

Wie erkenne ich, in welcher Sprache ein Text mit NLTK geschrieben wurde? Die Beispiele, die ich gesehen habe, verwendennltk.detect, aber wenn ich es auf meinem Mac installiert habe, kann ich dieses Paket nicht finden.