Suchergebnisse für Anfrage "tm"
Ersetzen Sie Wörter im Korpus entsprechend dem Wörterbuchdatenrahmen
Ich bin daran interessiert, alle Wörter in a zu ersetzen
R TM -Paket: UTF-8-Text
Ich möchte eine Wortwolke für nicht-englischen Text in utf-8 erstellen (eigentlich ist es in kasachischer Sprache). Der Text wird in der Prüffunktion des tm-Pakets absolut richtig angezeigt. Wenn ich jedoch nach der Worthäufigkeit suche, wird ...
Verwenden Sie R, um PDF-Dateien in Textdateien für Text Mining zu konvertieren
Ich habe fast tausend PDF-Zeitschriftenartikel in einem Ordner. Ich muss mir eine SMS mit allen Abstracts des Artikels aus dem gesamten Ordner schicken. Jetzt mache ich folgendes: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to ...
R tm In mclapply (content (x), FUN,…): Alle geplanten Kerne haben Fehler im Benutzercode festgestellt
Wenn ich die folgenden Codes in der vorletzten Zeile ausführe, wird eine Warnmeldung angezeigt: In mclapply (content (x), FUN, ...): Bei allen geplanten Kernen sind Fehler im Benutzercode aufgetreten Als ich die letzte Linie laufen ließ, bekam ...
Entfernen zu häufiger Wörter (kommen in mehr als 80% der Dokumente vor) in R
Ich arbeite mit dem 'tm'-Paket, um ein Korpus zu erstellen. Ich habe die meisten Vorverarbeitungsschritte durchgeführt. Der Rest besteht darin, zu häufige Wörter zu entfernen (Begriffe, die in mehr als 80% der Dokumente vorkommen). Kann ...
big document term matrix - Fehler beim Zählen der Anzahl der Zeichen von Dokumenten
Ich habe mit dem Paket @ eine große Dokumentterm-Matrix erstellRTextTools. etzt versuche ich, die Anzahl der Zeichen in den Matrixzeilen zu zählen, damit ich leere Dokumente entfernen kann, bevor ich eine Themenmodellierung durchführ Mein Code ...
Duplikate aus der Liste entfernen, basierend auf semantischer Ähnlichkeit / Verwandtschaft
R + tm: Wie kann ich Elemente in einer Liste auf Grundlage der semantischen Ähnlichkeit desuplizieren?v<-c("bank","banks","banking", "ford_suv',"toyota_suv","nissan_suv"). Meine erwartete Lösung ...
Dictionary () wird im tm-Paket nicht mehr unterstützt. Wie kann man Code emendieren?
Mir ist erst nach dem Update auf aufgefallentm v. 0.5-10 die FunktionDictionary() wird nicht mehr unterstützt. Ist das ein Fehler? Oder war es veraltet? Soll ich zum Erstellen eines Wörterbuchs eine andere Funktion verwenden? Da ich jetzt viele ...
R-Korpus verwirrt meinen UTF-8-kodierten Text
Ich versuche einfach, ein Korpus aus russischem UTF-8-codiertem Text zu erstellen. Das Problem ist, die Corpus-Methode aus dertm Paket codiert die Zeichenfolgen nicht richtig. Hier ist ein reproduzierbares Beispiel für mein Problem: Laden Sie ...