Suchergebnisse für Anfrage "tm"

5 die antwort

tm: Datenrahmen einlesen, Text-IDs behalten, DTM erstellen und mit anderem Datensatz verbinden

Ich verwende das Paket tm. Say Ich habe einen Datenrahmen von 2 Spalten, 500 Zeilen. Die erste Spalte ist die ID, die zufällig generiert wird und sowohl Zeichen als auch Nummer enthält: "txF87uyK" Die zweite Spalte ist der aktuelle Text: "Das ...

1 die antwort

Programmatisch ein Tickersymbol in R @ nachschlag

Ich habe ein Datenfeld mit Firmennamen, z. B. company <- c("Microsoft", "Apple", "Cloudera", "Ford") > company Company 1 Microsoft 2 Apple 3 Cloudera 4 Fordund so weiter Das Pakettm.plugin.webminingit @ können Sie Daten von Yahoo! ...

1 die antwort

tm verliert die Metadaten beim Anwenden von tm_map

Ich habe ein (kleines) Problem mit der TMR-Bibliothek. sage ich habe einen Korpus: # boilerplate bcorp <- c("one","two","three","four","five") myCorpus <- Corpus(VectorSource(bcorp), list(lanuage = "en_US")) tdm <- TermDocumentMatrix(myCorpus) ...

TOP-Veröffentlichungen

2 die antwort

Entfernen zu häufiger Wörter (kommen in mehr als 80% der Dokumente vor) in R

Ich arbeite mit dem 'tm'-Paket, um ein Korpus zu erstellen. Ich habe die meisten Vorverarbeitungsschritte durchgeführt. Der Rest besteht darin, zu häufige Wörter zu entfernen (Begriffe, die in mehr als 80% der Dokumente vorkommen). Kann ...

1 die antwort

Big Text Corpus bricht tm_map

Ich habe mir in den letzten Tagen den Kopf gebrochen. Ich habe alle SO-Archive durchsucht und die vorgeschlagenen Lösungen ausprobiert, aber es scheint, als würde dies nicht funktionieren. Ich habe Sätze von txt-Dokumenten in Ordnern wie 2000 ...

4 die antwort

So wählen Sie nur eine Teilmenge der Korpusbegriffe für die TermDocumentMatrix-Erstellung in tm @ a

Ich habe ein riesiges Korpus und interessiere mich nur für das Erscheinen einer Handvoll Begriffe, die ich von vornherein kenne. Gibt es eine Möglichkeit, eine Term-Dokumentenmatrix aus dem Korpus mit dem @ zu erstelletm -Paket, in dem nur von ...

14 die antwort

FUN-Fehler nach dem Ausführen von 'tolower', während Twitter wordcloud @ gemacht wi

Versuche, eine Wortwolke aus Twitter-Daten zu erstellen, erhalte jedoch den folgenden Fehler: Error in FUN(X[[72L]], ...) : invalid input '������������❤������������ "@xxx:bla, bla, bla... http://t.co/56Fb78aTSC"' in 'utf8towcs'Dieser ...

4 die antwort

R und TM-Paket: Erstellen einer Term-Document-Matrix mit einem Wörterbuch aus einem oder zwei Wörtern?

Zweck Ich möchte ein @ erstell term-document matrix Verwendung einerWörterbuc mit zusammengesetzten Wörtern oder bigrams, wie einige derSchlüsselwörte. Web-Suche Als Neuling im Text-Mining und imtm Paket inR, Ich bin ins Internet gegangen, um ...

2 die antwort

big document term matrix - Fehler beim Zählen der Anzahl der Zeichen von Dokumenten

Ich habe mit dem Paket @ eine große Dokumentterm-Matrix erstellRTextTools. etzt versuche ich, die Anzahl der Zeichen in den Matrixzeilen zu zählen, damit ich leere Dokumente entfernen kann, bevor ich eine Themenmodellierung durchführ Mein Code ...

6 die antwort

Wie funktioniert das removeSparseTerms in R?

Ich verwende die Methode removeSparseTerms in R und es muss ein Schwellenwert eingegeben werden. Ich habe auch gelesen, dass die Anzahl der in der zurückgegebenen Matrix enthaltenen Terme umso höher ist, je höher der Wert ist. Wie funktioniert ...