Suchergebnisse für Anfrage "nlp"
Python: Goslate-Übersetzungsanforderung gibt "503: Dienst nicht verfügbar" zurück [geschlossen]
or ein paar Monaten habe ich Pythons @ benutgoslate package, um eine Reihe französischer Texte ins Englische zu übersetzen. Als ich dies heute Morgen versuchte, gab der Dienst einen Fehler zurück: import goslate gs = goslate.Goslate() print ...
Zugmodell mit benannter Entität
Ich suche auf Standford Corenlp mit dem Named Entity REcognizer.Ich habe verschiedene Arten von Eingabetext und ich muss ihn in meine eigene Entität taggen.So fing ich an, mein eigenes Modell zu trainieren und es scheint nicht ...
Sentence Ähnlichkeit mit WS4J
Ich möchte ws4j verwenden, um die Ähnlichkeit zwischen zwei Sätzen zu berechnen. Ich benutze die Online Demo von WS4J @ WS4J Online-Demo [http://ws4jdemo.appspot.com/<br/] Ich verwende die von WS4J vorgegebenen Beispielsätze. Nach der Eingabe ...
Probleme, die informativste Funktionen mit scikit learn erhalten?
Im Versuch, die informativsten Funktionen von einem @ zu erhalttextual corpus [http://pastebin.com/3qYc9mfZ]. Daraus gut ...
Wie speichere ich Python NLTK-Ausrichtungsmodelle für die spätere Verwendung?
n Python verwende ichNLTK's alignment module [http://www.nltk.org/api/nltk.align.html], um Wortausrichtungen zwischen parallelen Texten zu erstellen. Das Ausrichten von Bitexten kann ein zeitaufwändiger Vorgang sein, insbesondere wenn dies über ...
stanford corenlp, Aufteilen von Sätzen, Abkürzungsausnahmen
Ist in Stanford Corenlp eine Option für die Angabe von Abkürzungen verfügbar? Zum Beispiel im Satz:The reason pt. stayed at home was to rest. pt ist die Abkürzung für patient und corenlp teilt sie fälschlicherweise in zwei Sätze auf. Ich habe ...
Identifizieren Sie Prepositons und einzelne POS
Ich versuche, für jedes Wort im Absatz die richtigen Wortarten zu finden. Ich benutze Stanford POS Tagger. Ich stecke jedoch an einem Punkt fest. Ich möchte Präpositionen aus dem Absatz identifizieren. Penn Treebank Tagset sagt Folgendes: IN ...
Name Extraktion - CV / Resume - Stanford NER / OpenNLP
Ich arbeite derzeit an einem Lernprojekt, um einen individuellen Namen aus dem Lebenslauf / Lebenslauf zu extrahieren. egenwärtig arbeite ich mit Stanford-NER und OpenNLP zusammen, die beide mit einem gewissen Erfolg auf der Suche nach ...
Speichern und erneutes Verwenden von TfidfVectorizer in scikit learn
Ich benutze TfidfVectorizer in scikit und lerne, eine Matrix aus Textdaten zu erstellen. Jetzt muss ich dieses Objekt speichern, um es später wiederzuverwenden. Ich habe versucht, pickle zu verwenden, aber es gab den folgenden ...
Python NLTK pos_tag gibt nicht den richtigen Wortart-Tag zurück
Haben dies: text = word_tokenize("The quick brown fox jumps over the lazy dog")Und läuft nltk.pos_tag(text)Ich bekomme [('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ('lazy', ...