Suchergebnisse für Anfrage "tm"

2 die antwort

Duplikate aus der Liste entfernen, basierend auf semantischer Ähnlichkeit / Verwandtschaft

R + tm: Wie kann ich Elemente in einer Liste auf Grundlage der semantischen Ähnlichkeit desuplizieren?v<-c("bank","banks","banking", "ford_suv',"toyota_suv","nissan_suv"). Meine erwartete Lösung ...

4 die antwort

Wie analysiere ich eine Datums- / Uhrzeitzeichenfolge, die die Bruchzeit enthält?

Ich habe eine Datums- / Uhrzeitzeichenfolge: 20: 48: 01.469 UTC 31. März 2016 Ich möchte diese Zeichenfolgendarstellung der Zeit in ein @ konvertierestruct tm usingstrptime, aber meine Formatzeichenfolge funktioniert nicht. Gibt es einen ...

4 die antwort

Wie man den Anfang und das Ende von Satzmarkierungen mit quanteda @ behä

Ich versuche, 3 Gramm mit Rs zu erstellenquanteda package. Ich habe Mühe, einen Weg zu finden, um den Anfang und das Ende der Satzmarkierungen in n-Gramm zu halte<s> und</s> wie im Code unten. Ich dachte, dass mit demkeptFeatures mit einem ...

TOP-Veröffentlichungen

4 die antwort

Text Mining mit TM-Paket in R, entfernen Sie Wörter, die mit [http] beginnen, oder jedes andere spezifische Wort

Ich bin neu in R und Text Mining. Ich hatte aus Twitter-Feeds eine Wortwolke gemacht, die mit einem Begriff in Verbindung stand. Das Problem, mit dem ich konfrontiert bin, ist, dass in der Wordcloud http: ... oder htt ... angezeigt wird. Wie gehe ...

8 die antwort

Wie kann ich feststellen, welche ältere Version des R-Pakets mit meiner R-Version kompatibel ist?

Ich versuche, das "tm" -Paket zu installieren, aber dann erhalte ich die Fehlermeldung, dass "tm" für meine R-Version nicht verfügbar ist. package ‘tm’ is not available (for R version 3.0.2)Aber dann habe ich gesehen, dass jemand mir ...

6 die antwort

Wie funktioniert das removeSparseTerms in R?

Ich verwende die Methode removeSparseTerms in R und es muss ein Schwellenwert eingegeben werden. Ich habe auch gelesen, dass die Anzahl der in der zurückgegebenen Matrix enthaltenen Terme umso höher ist, je höher der Wert ist. Wie funktioniert ...

2 die antwort

big document term matrix - Fehler beim Zählen der Anzahl der Zeichen von Dokumenten

Ich habe mit dem Paket @ eine große Dokumentterm-Matrix erstellRTextTools. etzt versuche ich, die Anzahl der Zeichen in den Matrixzeilen zu zählen, damit ich leere Dokumente entfernen kann, bevor ich eine Themenmodellierung durchführ Mein Code ...

4 die antwort

R und TM-Paket: Erstellen einer Term-Document-Matrix mit einem Wörterbuch aus einem oder zwei Wörtern?

Zweck Ich möchte ein @ erstell term-document matrix Verwendung einerWörterbuc mit zusammengesetzten Wörtern oder bigrams, wie einige derSchlüsselwörte. Web-Suche Als Neuling im Text-Mining und imtm Paket inR, Ich bin ins Internet gegangen, um ...

14 die antwort

FUN-Fehler nach dem Ausführen von 'tolower', während Twitter wordcloud @ gemacht wi

Versuche, eine Wortwolke aus Twitter-Daten zu erstellen, erhalte jedoch den folgenden Fehler: Error in FUN(X[[72L]], ...) : invalid input '������������❤������������ "@xxx:bla, bla, bla... http://t.co/56Fb78aTSC"' in 'utf8towcs'Dieser ...

4 die antwort

So wählen Sie nur eine Teilmenge der Korpusbegriffe für die TermDocumentMatrix-Erstellung in tm @ a

Ich habe ein riesiges Korpus und interessiere mich nur für das Erscheinen einer Handvoll Begriffe, die ich von vornherein kenne. Gibt es eine Möglichkeit, eine Term-Dokumentenmatrix aus dem Korpus mit dem @ zu erstelletm -Paket, in dem nur von ...