Suchergebnisse für Anfrage "tm"
So wählen Sie nur eine Teilmenge der Korpusbegriffe für die TermDocumentMatrix-Erstellung in tm @ a
Ich habe ein riesiges Korpus und interessiere mich nur für das Erscheinen einer Handvoll Begriffe, die ich von vornherein kenne. Gibt es eine Möglichkeit, eine Term-Dokumentenmatrix aus dem Korpus mit dem @ zu erstelletm -Paket, in dem nur von ...
R TM -Paket: UTF-8-Text
Ich möchte eine Wortwolke für nicht-englischen Text in utf-8 erstellen (eigentlich ist es in kasachischer Sprache). Der Text wird in der Prüffunktion des tm-Pakets absolut richtig angezeigt. Wenn ich jedoch nach der Worthäufigkeit suche, wird ...
Big Text Corpus bricht tm_map
Ich habe mir in den letzten Tagen den Kopf gebrochen. Ich habe alle SO-Archive durchsucht und die vorgeschlagenen Lösungen ausprobiert, aber es scheint, als würde dies nicht funktionieren. Ich habe Sätze von txt-Dokumenten in Ordnern wie 2000 ...
Wie man den Anfang und das Ende von Satzmarkierungen mit quanteda @ behä
Ich versuche, 3 Gramm mit Rs zu erstellenquanteda package. Ich habe Mühe, einen Weg zu finden, um den Anfang und das Ende der Satzmarkierungen in n-Gramm zu halte<s> und</s> wie im Code unten. Ich dachte, dass mit demkeptFeatures mit einem ...
Dictionary () wird im tm-Paket nicht mehr unterstützt. Wie kann man Code emendieren?
Mir ist erst nach dem Update auf aufgefallentm v. 0.5-10 die FunktionDictionary() wird nicht mehr unterstützt. Ist das ein Fehler? Oder war es veraltet? Soll ich zum Erstellen eines Wörterbuchs eine andere Funktion verwenden? Da ich jetzt viele ...
stemCompletion funktioniert nicht
Ich verwende das TM-Paket für die Textanalyse von Reparaturdaten, das Lesen von Daten in einen Datenrahmen, die Konvertierung in ein Corpus-Objekt sowie verschiedene Methoden zum Bereinigen von Daten mithilfe von "lower", "stipWhitespace", ...
Entfernen zu häufiger Wörter (kommen in mehr als 80% der Dokumente vor) in R
Ich arbeite mit dem 'tm'-Paket, um ein Korpus zu erstellen. Ich habe die meisten Vorverarbeitungsschritte durchgeführt. Der Rest besteht darin, zu häufige Wörter zu entfernen (Begriffe, die in mehr als 80% der Dokumente vorkommen). Kann ...
R: Titel zu wordcloud graphics / png hinzufügen
Ich habe einen funktionierenden R-Code, der eine Tag-Cloud aus einer Term-Document-Matrix generiert.Jetzt möchte ich aus vielen Dokumenten eine ganze Reihe v...
R-Korpus verwirrt meinen UTF-8-kodierten Text
Ich versuche einfach, ein Korpus aus russischem UTF-8-codiertem Text zu erstellen. Das Problem ist, die Corpus-Methode aus dertm Paket codiert die Zeichenfolgen nicht richtig. Hier ist ein reproduzierbares Beispiel für mein Problem: Laden Sie ...