Suchergebnisse für Anfrage "nlp"

2 die antwort

Maltparser gibt Fehler in NLTK

Mein COde ist from nltk.parse import malt mp = malt.MaltParser(working_dir="/other/apps/maltparser-1.8.1",mco="engmalt.poly-1.7.mco",additional_java_args=['-Xmx1024m']) print mp.raw_parse("Hello World")Und der Fehler ist Traceback (most recent ...

4 die antwort

Gibt es eine Möglichkeit, die "ursprünglichen" Textdaten für OpenNLP abzurufen?

Ich weiß, dass diese Frage schon einmal gestellt wurde - aber die Antwort war nicht zufriedenstellend (in diesem Sinne war die Antwort nur ein Link). Also meine Frage ist, gibt es eine Möglichkeit, die bestehenden openNLP-Modelle zu erweitern? ...

2 die antwort

Identifizieren Sie aus der Liste der Zeichenfolgen, welche menschliche Namen sind und welche nicht

Ich habe einen Vektor wie den folgenden und möchte feststellen, welche Elemente in der Liste menschliche Namen sind und welche nicht. Ich habe das humaniformat-Paket gefunden, das Namen formatiert, aber leider nicht feststellt, ob ein String ...

TOP-Veröffentlichungen

2 die antwort

PTB Baumbank von CoNLL-X

Ich habe eine Baumbank im CoNLL-X-Format und den entsprechenden binären Analysebaum für jeden Satz, und ich möchte ihn in ein PTB-Format konvertieren. Gibt es Konverter oder kann jemand das PTB-Format beleuchten?

2 die antwort

Wie verwende ich CountVectorizerand () von sklearn, um n-Gramme zu erhalten, die Interpunktionen als separate Token enthalten?

Ich benutze sklearn.feature_extraction.text.CountVectorizer [http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html] , um n-Gramm zu berechnen. Beispiel import sklearn.feature_extraction.text # ...

12 die antwort

NLTK Named Entity-Erkennung zu einer Python-Liste

Ich habe NLTK's @ benutne_chunk um benannte Entitäten aus einem Text zu extrahieren: my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, the top federal prosecutor in ...

2 die antwort

alle möglichen Wortform-Vervollständigungen eines (biomedizinischen) Wortstamms

Ich kenne mich mit Wortstamm und Vervollständigung aus dem TM-Paket in R aus. Ich versuche eine schnelle und schmutzige Methode zu finden, um alle Varianten eines bestimmten Wortes (innerhalb eines Korpus) zu finden. Zum Beispiel möchte ich ...

8 die antwort

Wie berechnet man Präzision, Rückruf, Genauigkeit und f1-Score für den Mehrklassenfall mit scikit learn?

Ich arbeite in einem Problem mit der Stimmungsanalyse. Die Daten sehen folgendermaßen aus: label instances 5 1190 4 838 3 239 1 204 2 127So sind meine Daten seit 1190 unausgeglicheninstances sind mit @ gekennzeichn5. Für die ...

4 die antwort

Wie berechne ich den kürzesten (geodätischen) Weg zwischen zwei Adjektiven in WordNet mit Python NLTK?

Die Berechnung der semantischen Ähnlichkeit zwischen zwei Synsets in WordNet kann auf einfache Weise mit verschiedenen integrierten Ähnlichkeitsmaßen erfolgen, z. B ...

8 die antwort

Wie beschrifte ich einen Wortcluster automatisch mit Semantik?

Der Kontext ist: Ich habe bereits Wortgruppen (Phrasen), die sich aus kmeans ergeben, die auf Internet-Suchanfragen angewendet wurden, und die in den Suchmaschinenergebnissen als Distanz gebräuchliche URLs verwenden (gemeinsames Auftreten von ...