Suchergebnisse für Anfrage "text-mining"
Verwenden Sie R, um PDF-Dateien in Textdateien für Text Mining zu konvertieren
Ich habe fast tausend PDF-Zeitschriftenartikel in einem Ordner. Ich muss mir eine SMS mit allen Abstracts des Artikels aus dem gesamten Ordner schicken. Jetzt mache ich folgendes: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to ...
So werden Konversationsdaten in Paare von (Kontext, Antwort) @ aufgetei
Ich verwende das Gensim Doc2Vec-Modell und versuche, Teile von Kundenunterstützungsgesprächen zu gruppieren. Mein Ziel ist es, dem Support-Team Vorschläge für automatische Antworten zu unterbreiten. Abbildung 1 zeigt ein Beispiel für eine ...
Big Text Corpus bricht tm_map
Ich habe mir in den letzten Tagen den Kopf gebrochen. Ich habe alle SO-Archive durchsucht und die vorgeschlagenen Lösungen ausprobiert, aber es scheint, als würde dies nicht funktionieren. Ich habe Sätze von txt-Dokumenten in Ordnern wie 2000 ...
Text Mining mit TM-Paket in R, entfernen Sie Wörter, die mit [http] beginnen, oder jedes andere spezifische Wort
Ich bin neu in R und Text Mining. Ich hatte aus Twitter-Feeds eine Wortwolke gemacht, die mit einem Begriff in Verbindung stand. Das Problem, mit dem ich konfrontiert bin, ist, dass in der Wordcloud http: ... oder htt ... angezeigt wird. Wie gehe ...
“RTextTools” create_matrix hat einen Fehler erhalten
Ich habe das RTextTools-Paket ausgeführt, um ein Textklassifizierungsmodell zu erstellen. Und als ich den Vorhersagedatensatz vorbereitete und versuchte, ihn in eine Matrix umzuwandeln. Ich habe den Fehler erhalten als: Error in if ...
Erstellen Sie im Rtm-Paket das Corpus FROM Document-Term-Matrix
Es ist ganz einfach, mit dem tm-Paket eine Dokumenten-Term-Matrix aus einem Korpus zu erstellen. Ich möchte einen Korpus aus einer Dokumenten-Term-Matrix erstellen. Sei M die Anzahl der Dokumente in einem Dokumentensatz. Sei V die Anzahl ...
big document term matrix - Fehler beim Zählen der Anzahl der Zeichen von Dokumenten
Ich habe mit dem Paket @ eine große Dokumentterm-Matrix erstellRTextTools. etzt versuche ich, die Anzahl der Zeichen in den Matrixzeilen zu zählen, damit ich leere Dokumente entfernen kann, bevor ich eine Themenmodellierung durchführ Mein Code ...
Informationsgewinnberechnung für eine Textdatei?
Ich arbeite anTextkategorisierung unter Verwendung von Informationsgewinn, PCA und genetischem AlgorithmusAber nach dem AuftrittVorverarbeitung(Stemming, Stopword Removal, TFIDF) auf dem Dokument m verwirrt, wie man voranschreitet, ...