Suchergebnisse für Anfrage "nltk"

2 die antwort

Frequenz der Wörter und NLTK

Ich habe eine Datei mit verschiedenen Wörtern, mit denen ich die Häufigkeit jedes Wortes im Dokument zählen und plotten möchte. Mein Plot zeigt jedoch keine Ergebnisse. Dasx-axis muss die Wörter enthalten und dasy-axis die Frequenz. ...

6 die antwort

Wie speichere ich Python NLTK-Ausrichtungsmodelle für die spätere Verwendung?

n Python verwende ichNLTK's alignment module [http://www.nltk.org/api/nltk.align.html], um Wortausrichtungen zwischen parallelen Texten zu erstellen. Das Ausrichten von Bitexten kann ein zeitaufwändiger Vorgang sein, insbesondere wenn dies über ...

2 die antwort

Auf ein Verzeichnis in einer Flask-App zuzugreifen funktioniert nur, wenn der Pfad absolut ist

Ich habe nltk-Daten in das Datenverzeichnis in meiner Flask-App heruntergeladen. Die Ansichten befinden sich in einem Entwurf in einem anderen Verzeichnis auf derselben Ebene wie das Datenverzeichnis. In der Ansicht versuche ich, den Pfad zu den ...

TOP-Veröffentlichungen

12 die antwort

Extrahieren Sie die Liste der Personen und Organisationen, die Stanford NER Tagger in NLTK verwenden.

Ich versuche, mit dem Stanford Named Entity Recognizer (NER) in Python NLTK eine Liste von Personen und Organisationen zu extrahieren. Wenn ich renne: from nltk.tag.stanford import NERTagger st ...

2 die antwort

Python NLTK pos_tag gibt nicht den richtigen Wortart-Tag zurück

Haben dies: text = word_tokenize("The quick brown fox jumps over the lazy dog")Und läuft nltk.pos_tag(text)Ich bekomme [('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ('lazy', ...

6 die antwort

Kosinus Ähnlichkeit von Vektoren unterschiedlicher Länge?

Ich versuche TF-IDF zu benutzen [https://stackoverflow.com/questions/3113428/classifying-documents-into-categories/3114191#3114191] , um Dokumente in Kategorien zu sortieren. Ich habe die tf_idf für einige Dokumente berechnet, aber jetzt, wenn ...

6 die antwort

Dokumente in Kategorien einteilen

Ich habe ungefähr 300.000 Dokumente in einer Postgres-Datenbank gespeichert, die mit Themenkategorien versehen sind (es gibt insgesamt ungefähr 150 Kategorien). Ich habe weitere 150.000 Dokumente, die noch keine Kategorien haben. Ich versuche, ...

8 die antwort

Wie beschrifte ich einen Wortcluster automatisch mit Semantik?

Der Kontext ist: Ich habe bereits Wortgruppen (Phrasen), die sich aus kmeans ergeben, die auf Internet-Suchanfragen angewendet wurden, und die in den Suchmaschinenergebnissen als Distanz gebräuchliche URLs verwenden (gemeinsames Auftreten von ...

2 die antwort

Hat NLTK ein Tool zum Parsen von Abhängigkeiten?

Ich erstelle eine NLP-Anwendung und benutze den Stanford Parser für die meisten meiner Parsing-Arbeiten, möchte aber Python verwenden. Bisher scheint NLTK die beste Wahl zu sein, aber ich kann nicht herausfinden, wie man grammatische ...

4 die antwort

Wie berechne ich den kürzesten (geodätischen) Weg zwischen zwei Adjektiven in WordNet mit Python NLTK?

Die Berechnung der semantischen Ähnlichkeit zwischen zwei Synsets in WordNet kann auf einfache Weise mit verschiedenen integrierten Ähnlichkeitsmaßen erfolgen, z. B ...