Suchergebnisse für Anfrage "tm"

2 die antwort

Ersetzen Sie Wörter im Korpus entsprechend dem Wörterbuchdatenrahmen

Ich bin daran interessiert, alle Wörter in a zu ersetzen

2 die antwort

R TM -Paket: UTF-8-Text

Ich möchte eine Wortwolke für nicht-englischen Text in utf-8 erstellen (eigentlich ist es in kasachischer Sprache). Der Text wird in der Prüffunktion des tm-Pakets absolut richtig angezeigt. Wenn ich jedoch nach der Worthäufigkeit suche, wird ...

2 die antwort

Verwenden Sie R, um PDF-Dateien in Textdateien für Text Mining zu konvertieren

Ich habe fast tausend PDF-Zeitschriftenartikel in einem Ordner. Ich muss mir eine SMS mit allen Abstracts des Artikels aus dem gesamten Ordner schicken. Jetzt mache ich folgendes: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to ...

TOP-Veröffentlichungen

2 die antwort

R tm In mclapply (content (x), FUN,…): Alle geplanten Kerne haben Fehler im Benutzercode festgestellt

Wenn ich die folgenden Codes in der vorletzten Zeile ausführe, wird eine Warnmeldung angezeigt: In mclapply (content (x), FUN, ...): Bei allen geplanten Kernen sind Fehler im Benutzercode aufgetreten Als ich die letzte Linie laufen ließ, bekam ...

2 die antwort

Entfernen zu häufiger Wörter (kommen in mehr als 80% der Dokumente vor) in R

Ich arbeite mit dem 'tm'-Paket, um ein Korpus zu erstellen. Ich habe die meisten Vorverarbeitungsschritte durchgeführt. Der Rest besteht darin, zu häufige Wörter zu entfernen (Begriffe, die in mehr als 80% der Dokumente vorkommen). Kann ...

2 die antwort

big document term matrix - Fehler beim Zählen der Anzahl der Zeichen von Dokumenten

Ich habe mit dem Paket @ eine große Dokumentterm-Matrix erstellRTextTools. etzt versuche ich, die Anzahl der Zeichen in den Matrixzeilen zu zählen, damit ich leere Dokumente entfernen kann, bevor ich eine Themenmodellierung durchführ Mein Code ...

2 die antwort

Duplikate aus der Liste entfernen, basierend auf semantischer Ähnlichkeit / Verwandtschaft

R + tm: Wie kann ich Elemente in einer Liste auf Grundlage der semantischen Ähnlichkeit desuplizieren?v<-c("bank","banks","banking", "ford_suv',"toyota_suv","nissan_suv"). Meine erwartete Lösung ...

3 die antwort

Wie kann ich die Dokument-ID in einem Korpus manuell festlegen?

3 die antwort

Dictionary () wird im tm-Paket nicht mehr unterstützt. Wie kann man Code emendieren?

Mir ist erst nach dem Update auf aufgefallentm v. 0.5-10 die FunktionDictionary() wird nicht mehr unterstützt. Ist das ein Fehler? Oder war es veraltet? Soll ich zum Erstellen eines Wörterbuchs eine andere Funktion verwenden? Da ich jetzt viele ...

3 die antwort

R-Korpus verwirrt meinen UTF-8-kodierten Text

Ich versuche einfach, ein Korpus aus russischem UTF-8-codiertem Text zu erstellen. Das Problem ist, die Corpus-Methode aus dertm Paket codiert die Zeichenfolgen nicht richtig. Hier ist ein reproduzierbares Beispiel für mein Problem: Laden Sie ...