Suchergebnisse für Anfrage "nlp"

4 die antwort

Gensim word2vec für vordefinierte Wörterbuch- und Wortindexdaten

Ich muss eine word2vec-Darstellung auf Tweets mit gensim trainieren. Im Gegensatz zu den meisten Tutorials und Codes, die ich auf gensim gesehen habe, sind meine Daten nicht roh, sondern wurden bereits vorverarbeitet. Ich habe ein Wörterbuch in ...

6 die antwort

Wie finde ich heraus, ob ein Satz eine Frage ist (fragend)?

Gibt es eine Open-Source-Java-Bibliothek / einen Open-Source-Java-Algorithmus, um herauszufinden, ob ein bestimmter Text eine Frage ist oder nicht? ch arbeite an einem Fragebeantwortungssystem, das analysieren muss, ob der vom Benutzer ...

4 die antwort

Stanford NER in NLTK markiert mehrere Sätze nicht richtig - Python

Ich habe eine Funktion, die die benannten Entitäten in einem bestimmten Textkörper mit der Stanford-NER zurückgibt. def get_named_entities(text): load_ner_files() print text[:100] # to show that the text is fine text_split = text.split() print ...

TOP-Veröffentlichungen

8 die antwort

Ändern der Wörter, wobei die Bedeutung erhalten bleibt [closed]

Wir haben eine Anforderung, bei der wir die Wörter oder Phrasen im Satz ändern müssen, während die Bedeutung erhalten bleibt. Diese Anwendung wird Benutzern, die mit dem Erstellen von Texten befasst sind, Vorschläge unterbreiten. Ich weiß nicht, ...

4 die antwort

Wie man den Anfang und das Ende von Satzmarkierungen mit quanteda @ behä

Ich versuche, 3 Gramm mit Rs zu erstellenquanteda package. Ich habe Mühe, einen Weg zu finden, um den Anfang und das Ende der Satzmarkierungen in n-Gramm zu halte<s> und</s> wie im Code unten. Ich dachte, dass mit demkeptFeatures mit einem ...

2 die antwort

Wie finde ich die n-Gramm-Häufigkeit einer Spalte in einem Pandas-Datenrahmen?

Below ist der Eingabepandas-Datenrahmen, den ich habe. [/imgs/ltSrD.png] Ich möchte die Häufigkeit von Unigrammen und Bigrammen ermitteln. Ein Beispiel von dem, was ich erwarte, ist unten gezeigt [/imgs/7NOKk.png] Wie mache ich das mit nltk ...

14 die antwort

N-Gramm-Generation aus, ein Satz

Wie man ein n-Gramm eines Strings erzeugt wie: String Input="This is my car."Ich möchte mit dieser Eingabe n-Gramm generieren: Input Ngram size = 3Output sollte sein: This is my car This is is my my car This is my is my carGeben Sie eine Idee ...

8 die antwort

Chunking Stanford Named Entity Recognizer (NER) -Ausgaben vom NLTK-Format

Ich verwende NER in NLTK, um Personen, Standorte und Organisationen in Sätzen zu finden. Ich bin in der Lage, die Ergebnisse wie folgt zu produzieren: [(u'Remaking', u'O'), (u'The', u'O'), (u'Republican', u'ORGANIZATION'), (u'Party', ...

2 die antwort

Wie Wortvektoren zu Satzvektoren verketten

Ich habe in einigen Aufsätzen (Tomas Mikolov ...) gelernt, dass ein besserer Weg, den Vektor für einen Satz zu bilden, darin besteht, den Wortvektor zu verketten. aber wegen meiner ungeschickten Mathematik bin ich mir noch nicht sicher, was die ...

4 die antwort

Verhindern, dass Stanford Core NLP Server den empfangenen Text ausgibt

Ich betreibe einStanford CoreNLP [http://stanfordnlp.github.io/CoreNLP/] server: java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9001 -timeout 50000Wenn Text empfangen wird, wird dieser in der Shell ausgegeben, in der ...