Suchergebnisse für Anfrage "nlp"

2 die antwort

Wie verwende ich CountVectorizerand () von sklearn, um n-Gramme zu erhalten, die Interpunktionen als separate Token enthalten?

Ich benutze sklearn.feature_extraction.text.CountVectorizer [http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html] , um n-Gramm zu berechnen. Beispiel import sklearn.feature_extraction.text # ...

2 die antwort

Identifizieren Sie aus der Liste der Zeichenfolgen, welche menschliche Namen sind und welche nicht

Ich habe einen Vektor wie den folgenden und möchte feststellen, welche Elemente in der Liste menschliche Namen sind und welche nicht. Ich habe das humaniformat-Paket gefunden, das Namen formatiert, aber leider nicht feststellt, ob ein String ...

2 die antwort

PTB Baumbank von CoNLL-X

Ich habe eine Baumbank im CoNLL-X-Format und den entsprechenden binären Analysebaum für jeden Satz, und ich möchte ihn in ein PTB-Format konvertieren. Gibt es Konverter oder kann jemand das PTB-Format beleuchten?

TOP-Veröffentlichungen

4 die antwort

Gibt es eine Möglichkeit, die "ursprünglichen" Textdaten für OpenNLP abzurufen?

Ich weiß, dass diese Frage schon einmal gestellt wurde - aber die Antwort war nicht zufriedenstellend (in diesem Sinne war die Antwort nur ein Link). Also meine Frage ist, gibt es eine Möglichkeit, die bestehenden openNLP-Modelle zu erweitern? ...

12 die antwort

Wie man alle Arten von Datums- und Zeitwerten aus dem Text abruft

Ich wollte Datumsangaben und andere zeitliche Entitäten aus einer Reihe von Zeichenfolgen abrufen. Ist dies möglich, ohne die Zeichenfolge in JAVA nach Datumsangaben zu analysieren, da die meisten Parser nur einen begrenzten Bereich von ...

2 die antwort

Maltparser gibt Fehler in NLTK

Mein COde ist from nltk.parse import malt mp = malt.MaltParser(working_dir="/other/apps/maltparser-1.8.1",mco="engmalt.poly-1.7.mco",additional_java_args=['-Xmx1024m']) print mp.raw_parse("Hello World")Und der Fehler ist Traceback (most recent ...

2 die antwort

Visualize Parse Tree Structure

Ich möchte das Parsen (POS-Tagging) von @ anzeig openNLP als Baumstrukturvisualisierung. Unten stelle ich den Analysebaum von @ zur Verfügun openNLP aber ich kann nicht als visueller Baum plotten, der @ gemeinsam i Python analysiert ...

6 die antwort

Wie kann ich den gesamten Inhalt von Wordnet ausdrucken (vorzugsweise mit NLTK)?

NLTK bietet Funktionen zum Drucken aller Wörter im Brown-Korpus (oder Gutenberg-Korpus). Aber die entsprechende Funktion scheint bei Wordnet nicht zu funktionieren. Gibt es eine Möglichkeit, dies über NLTK zu tun? Wenn nicht, wie könnte man ...

4 die antwort

Die ähnliche Methode aus dem nltk-Modul führt auf verschiedenen Computern zu unterschiedlichen Ergebnissen. Warum

Ich habe ein paar Einführungskurse in Text Mining mit Python unterrichtet und die Klasse hat die ähnliche Methode mit den bereitgestellten Übungstexten ausprobiert. Einige Schüler haben andere Ergebnisse für text1.similar () erhalten als ...

6 die antwort

POS-Tagger ist unglaublich langsam

Ich benutzenltk, um n-Gramme aus Sätzen zu generieren, indem zuerst die angegebenen Stoppwörter entfernt werden. Jedoch,nltk.pos_tag() ist extrem langsam und benötigt auf meiner CPU (Intel i7) bis zu 0,6 Sekunden. Die Ausgabe ['The first time I ...