Suchergebnisse für Anfrage "text-mining"

2 die antwort

So werden Konversationsdaten in Paare von (Kontext, Antwort) @ aufgetei

Ich verwende das Gensim Doc2Vec-Modell und versuche, Teile von Kundenunterstützungsgesprächen zu gruppieren. Mein Ziel ist es, dem Support-Team Vorschläge für automatische Antworten zu unterbreiten. Abbildung 1 zeigt ein Beispiel für eine ...

2 die antwort

R Tidytext und unnest_tokens error

Sehr neu in R und haben begonnen, das Paket "tidytext" zu verwenden. Ich versuche, Argumente zu verwenden, um in die @ einzugebunnest_tokens Funktion, damit ich mehrere Spalten analysieren kann. Also stattdessen library(janeaustenr) ...

2 die antwort

Wie finde ich die n-Gramm-Häufigkeit einer Spalte in einem Pandas-Datenrahmen?

Below ist der Eingabepandas-Datenrahmen, den ich habe. [/imgs/ltSrD.png] Ich möchte die Häufigkeit von Unigrammen und Bigrammen ermitteln. Ein Beispiel von dem, was ich erwarte, ist unten gezeigt [/imgs/7NOKk.png] Wie mache ich das mit nltk ...

TOP-Veröffentlichungen

2 die antwort

Speicherfehler in Python mit Numpy-Array

Ich erhalte den folgenden Fehler für diesen Code: model = lda.LDA(n_topics=15, n_iter=50, random_state=1) model.fit(X) topic_word = model.topic_word_ print("type(topic_word): {}".format(type(topic_word))) print("shape: ...

4 die antwort

Wie man den Anfang und das Ende von Satzmarkierungen mit quanteda @ behä

Ich versuche, 3 Gramm mit Rs zu erstellenquanteda package. Ich habe Mühe, einen Weg zu finden, um den Anfang und das Ende der Satzmarkierungen in n-Gramm zu halte<s> und</s> wie im Code unten. Ich dachte, dass mit demkeptFeatures mit einem ...

2 die antwort

“RTextTools” create_matrix hat einen Fehler erhalten

Ich habe das RTextTools-Paket ausgeführt, um ein Textklassifizierungsmodell zu erstellen. Und als ich den Vorhersagedatensatz vorbereitete und versuchte, ihn in eine Matrix umzuwandeln. Ich habe den Fehler erhalten als: Error in if ...

4 die antwort

Text Mining mit TM-Paket in R, entfernen Sie Wörter, die mit [http] beginnen, oder jedes andere spezifische Wort

Ich bin neu in R und Text Mining. Ich hatte aus Twitter-Feeds eine Wortwolke gemacht, die mit einem Begriff in Verbindung stand. Das Problem, mit dem ich konfrontiert bin, ist, dass in der Wordcloud http: ... oder htt ... angezeigt wird. Wie gehe ...

2 die antwort

alle möglichen Wortform-Vervollständigungen eines (biomedizinischen) Wortstamms

Ich kenne mich mit Wortstamm und Vervollständigung aus dem TM-Paket in R aus. Ich versuche eine schnelle und schmutzige Methode zu finden, um alle Varianten eines bestimmten Wortes (innerhalb eines Korpus) zu finden. Zum Beispiel möchte ich ...

4 die antwort

Wirklich schnelle Wort-Ngram-Vektorisierung in R

edit: Das neue Paket text2vec ist exzellent und löst dieses Problem (und viele andere) wirklich gut. text2vec auf CRAN [https://cran.r-project.org/web/packages/text2vec/index.html] text2vec auf github [https://github.com/dselivanov/text2vec] ...

4 die antwort

CPU- und speichereffiziente NGram-Extraktion mit R

Ich habe einen Algorithmus geschrieben, der NGramme (Bigramme, Trigramme, ... bis 5 Gramm) aus einer Liste von 50000 Straßenadressen extrahiert. Mein Ziel ist es, für jede Adresse einen Booleschen Vektor zu haben, der angibt, ob die NGrams in der ...