Suchergebnisse für Anfrage "tm"

5 die antwort

tm: Datenrahmen einlesen, Text-IDs behalten, DTM erstellen und mit anderem Datensatz verbinden

Ich verwende das Paket tm. Say Ich habe einen Datenrahmen von 2 Spalten, 500 Zeilen. Die erste Spalte ist die ID, die zufällig generiert wird und sowohl Zeichen als auch Nummer enthält: "txF87uyK" Die zweite Spalte ist der aktuelle Text: "Das ...

1 die antwort

tm verliert die Metadaten beim Anwenden von tm_map

Ich habe ein (kleines) Problem mit der TMR-Bibliothek. sage ich habe einen Korpus: # boilerplate bcorp <- c("one","two","three","four","five") myCorpus <- Corpus(VectorSource(bcorp), list(lanuage = "en_US")) tdm <- TermDocumentMatrix(myCorpus) ...

1 die antwort

Programmatisch ein Tickersymbol in R @ nachschlag

Ich habe ein Datenfeld mit Firmennamen, z. B. company <- c("Microsoft", "Apple", "Cloudera", "Ford") > company Company 1 Microsoft 2 Apple 3 Cloudera 4 Fordund so weiter Das Pakettm.plugin.webminingit @ können Sie Daten von Yahoo! ...

TOP-Veröffentlichungen

2 die antwort

Entfernen zu häufiger Wörter (kommen in mehr als 80% der Dokumente vor) in R

Ich arbeite mit dem 'tm'-Paket, um ein Korpus zu erstellen. Ich habe die meisten Vorverarbeitungsschritte durchgeführt. Der Rest besteht darin, zu häufige Wörter zu entfernen (Begriffe, die in mehr als 80% der Dokumente vorkommen). Kann ...

1 die antwort

Big Text Corpus bricht tm_map

Ich habe mir in den letzten Tagen den Kopf gebrochen. Ich habe alle SO-Archive durchsucht und die vorgeschlagenen Lösungen ausprobiert, aber es scheint, als würde dies nicht funktionieren. Ich habe Sätze von txt-Dokumenten in Ordnern wie 2000 ...

4 die antwort

So wählen Sie nur eine Teilmenge der Korpusbegriffe für die TermDocumentMatrix-Erstellung in tm @ a

Ich habe ein riesiges Korpus und interessiere mich nur für das Erscheinen einer Handvoll Begriffe, die ich von vornherein kenne. Gibt es eine Möglichkeit, eine Term-Dokumentenmatrix aus dem Korpus mit dem @ zu erstelletm -Paket, in dem nur von ...

14 die antwort

FUN-Fehler nach dem Ausführen von 'tolower', während Twitter wordcloud @ gemacht wi

Versuche, eine Wortwolke aus Twitter-Daten zu erstellen, erhalte jedoch den folgenden Fehler: Error in FUN(X[[72L]], ...) : invalid input '������������❤������������ "@xxx:bla, bla, bla... http://t.co/56Fb78aTSC"' in 'utf8towcs'Dieser ...

4 die antwort

R und TM-Paket: Erstellen einer Term-Document-Matrix mit einem Wörterbuch aus einem oder zwei Wörtern?

Zweck Ich möchte ein @ erstell term-document matrix Verwendung einerWörterbuc mit zusammengesetzten Wörtern oder bigrams, wie einige derSchlüsselwörte. Web-Suche Als Neuling im Text-Mining und imtm Paket inR, Ich bin ins Internet gegangen, um ...

2 die antwort

big document term matrix - Fehler beim Zählen der Anzahl der Zeichen von Dokumenten

Ich habe mit dem Paket @ eine große Dokumentterm-Matrix erstellRTextTools. etzt versuche ich, die Anzahl der Zeichen in den Matrixzeilen zu zählen, damit ich leere Dokumente entfernen kann, bevor ich eine Themenmodellierung durchführ Mein Code ...

8 die antwort

Wie kann ich feststellen, welche ältere Version des R-Pakets mit meiner R-Version kompatibel ist?

Ich versuche, das "tm" -Paket zu installieren, aber dann erhalte ich die Fehlermeldung, dass "tm" für meine R-Version nicht verfügbar ist. package ‘tm’ is not available (for R version 3.0.2)Aber dann habe ich gesehen, dass jemand mir ...