Suchergebnisse für Anfrage "tm"

2 die antwort

R tm In mclapply (content (x), FUN,…): Alle geplanten Kerne haben Fehler im Benutzercode festgestellt

Wenn ich die folgenden Codes in der vorletzten Zeile ausführe, wird eine Warnmeldung angezeigt: In mclapply (content (x), FUN, ...): Bei allen geplanten Kernen sind Fehler im Benutzercode aufgetreten Als ich die letzte Linie laufen ließ, bekam ...

4 die antwort

stemCompletion funktioniert nicht

Ich verwende das TM-Paket für die Textanalyse von Reparaturdaten, das Lesen von Daten in einen Datenrahmen, die Konvertierung in ein Corpus-Objekt sowie verschiedene Methoden zum Bereinigen von Daten mithilfe von "lower", "stipWhitespace", ...

2 die antwort

R TM -Paket: UTF-8-Text

Ich möchte eine Wortwolke für nicht-englischen Text in utf-8 erstellen (eigentlich ist es in kasachischer Sprache). Der Text wird in der Prüffunktion des tm-Pakets absolut richtig angezeigt. Wenn ich jedoch nach der Worthäufigkeit suche, wird ...

TOP-Veröffentlichungen

2 die antwort

Verwenden Sie R, um PDF-Dateien in Textdateien für Text Mining zu konvertieren

Ich habe fast tausend PDF-Zeitschriftenartikel in einem Ordner. Ich muss mir eine SMS mit allen Abstracts des Artikels aus dem gesamten Ordner schicken. Jetzt mache ich folgendes: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to ...

3 die antwort

Dictionary () wird im tm-Paket nicht mehr unterstützt. Wie kann man Code emendieren?

Mir ist erst nach dem Update auf aufgefallentm v. 0.5-10 die FunktionDictionary() wird nicht mehr unterstützt. Ist das ein Fehler? Oder war es veraltet? Soll ich zum Erstellen eines Wörterbuchs eine andere Funktion verwenden? Da ich jetzt viele ...

4 die antwort

DocumentTermMatrix-Fehler im Corpus-Argument

Ich habe folgenden Code: # returns string w/o leading or trailing whitespace trim <- function (x) gsub("^\\s+|\\s+$", "", x) news_corpus <- Corpus(VectorSource(news_raw$text)) # a column of strings. corpus_clean <- tm_map(news_corpus, tolower) ...

0 die antwort

DocumentTermMatrix schlägt nur dann mit einem seltsamen Fehler fehl, wenn # terms> 3000

Der folgende Code funktioniert einwandfrei, es sei denn, ich erstelle eine DocumentTermMatrix mit mehr als 3000 Begriffen. Diese Linie: movie_dict <- findFreqTerms(movie_dtm_train, 8) movie_dtm_hiFq_train ...

1 die antwort

Erstellen Sie im Rtm-Paket das Corpus FROM Document-Term-Matrix

Es ist ganz einfach, mit dem tm-Paket eine Dokumenten-Term-Matrix aus einem Korpus zu erstellen. Ich möchte einen Korpus aus einer Dokumenten-Term-Matrix erstellen. Sei M die Anzahl der Dokumente in einem Dokumentensatz. Sei V die Anzahl ...

4 die antwort

R-Project keine anwendbare Methode für 'Meta', die auf ein Objekt der Klasse 'Charakter' angewendet wird

Ich versuche diesen Code auszuführen (Ubuntu 12.04, R 3.1.1) # Load requisite packages library(tm) library(ggplot2) library(lsa) # Place Enron email snippets into a single vector. text <- c( "To Mr. Ken Lay, I’m writing to urge you to donate the ...

3 die antwort

R-Korpus verwirrt meinen UTF-8-kodierten Text

Ich versuche einfach, ein Korpus aus russischem UTF-8-codiertem Text zu erstellen. Das Problem ist, die Corpus-Methode aus dertm Paket codiert die Zeichenfolgen nicht richtig. Hier ist ein reproduzierbares Beispiel für mein Problem: Laden Sie ...