Suchergebnisse für Anfrage "nlp"

2 die antwort

Nltk stanford pos tagger error: Java-Befehl fehlgeschlagen

Ich versuche, @ zu verwendnltk.tag.stanford module [http://www.nltk.org/api/nltk.tag.html#module-nltk.tag.stanford] für das Markieren eines Satzes (zuerst wie in Wikis Beispiel), aber ich erhalte weiterhin den folgenden Fehler: Traceback (most ...

2 die antwort

Was ist das CoNLL-Datenformat?

Ich bin neu im Text-Mining. Ich verwende eine Open-Source-JAR-Datei (Mate Parser), die mir nach dem Parsen von Abhängigkeiten eine Ausgabe im CoNLL 2009-Format liefert. Ich möchte die Ergebnisse der Abhängigkeitsanalyse für ...

6 die antwort

Splitting chinesisches Dokument in Sätze [geschlossen]

Ich muss chinesischen Text in mehrere Sätze aufteilen. Ich habe den Stanford DocumentPreProcessor ausprobiert. Es funktionierte ganz gut für Englisch, aber nicht für Chinesisch. Bitte teilen Sie mir gute Satzteiler für Chinesisch vorzugsweise ...

TOP-Veröffentlichungen

8 die antwort

Wie wird Gensim doc2vec mit vorab trainierten Wortvektoren verwendet?

Ich bin kürzlich auf die doc2vec-Erweiterung von Gensim gestoßen. Wie kann ich mit doc2vec vorab trainierte Wortvektoren verwenden (z. B. die auf der ursprünglichen word2vec-Website gefundenen)? Oder ruft doc2vec die Wortvektoren aus denselben ...

2 die antwort

Vereinfachung des französischen POS-Tag-Sets mit NLTK

Wie kann man den Teil der von Stanfords französischem POS-Tagger zurückgegebenen Sprach-Tags vereinfachen? Es ist ziemlich einfach, einen englischen Satz in NLTK zu lesen, den Wortteil eines jeden Wortes zu finden und dann mit map_tag () ...

8 die antwort

Understanding min_df und max_df in scikit CountVectorizer

Ich habe fünf Textdateien, die ich in einen CountVectorizer eingebe. Was bedeutet die minimale / maximale Dokumenthäufigkeit genau, wenn Sie für die CountVectorizer-Instanz min_df und max_df angeben? Ist es die Häufigkeit eines Wortes in seiner ...

4 die antwort

word2vec: negative Abtastung (in Laienform)?

Ich lese die nachstehende Abhandlung und habe Probleme, das Konzept der Negativabtastung zu verstehen. http: //arxiv.org/pdf/1402.3722v1.pd [http://arxiv.org/pdf/1402.3722v1.pdf] ann mir jemand helfen, bitt

12 die antwort

Text Mining mit PHP [geschlossen]

Ich mache ein Projekt für eine College-Klasse, die ich nehme. Ich benutze PHP, um eine einfache Web-App zu erstellen, die Tweets basierend auf einer Reihe von Wörterbüchern als "positiv" (oder glücklich) und "negativ" (oder traurig) ...

10 die antwort

Python Regex: Tokenisierung englischer Kontraktionen

Ich versuche, Zeichenfolgen so zu analysieren, dass alle Wortbestandteile, auch die vertraglich vereinbarten, herausgetrennt werden. Zum Beispiel wäre die Tokenisierung von "sollte nicht" ["sollte", "nicht"]. Das nltk-Modul scheint der Aufgabe ...

6 die antwort

Ermitteln, ob ein Wort ein Substantiv ist oder nicht

Gegeben ein Eingabewort, möchte ich feststellen, ob es ein Substantiv ist oder nicht (im Falle von Mehrdeutigkeiten, zum Beispielcook kann ein Substantiv oder ein Verb sein, das Wort muss als Substantiv identifiziert werden. Aktuell verwende ...