Suchergebnisse für Anfrage "tm"

4 die antwort

So wählen Sie nur eine Teilmenge der Korpusbegriffe für die TermDocumentMatrix-Erstellung in tm @ a

Ich habe ein riesiges Korpus und interessiere mich nur für das Erscheinen einer Handvoll Begriffe, die ich von vornherein kenne. Gibt es eine Möglichkeit, eine Term-Dokumentenmatrix aus dem Korpus mit dem @ zu erstelletm -Paket, in dem nur von ...

2 die antwort

R TM -Paket: UTF-8-Text

Ich möchte eine Wortwolke für nicht-englischen Text in utf-8 erstellen (eigentlich ist es in kasachischer Sprache). Der Text wird in der Prüffunktion des tm-Pakets absolut richtig angezeigt. Wenn ich jedoch nach der Worthäufigkeit suche, wird ...

1 die antwort

Big Text Corpus bricht tm_map

Ich habe mir in den letzten Tagen den Kopf gebrochen. Ich habe alle SO-Archive durchsucht und die vorgeschlagenen Lösungen ausprobiert, aber es scheint, als würde dies nicht funktionieren. Ich habe Sätze von txt-Dokumenten in Ordnern wie 2000 ...

TOP-Veröffentlichungen

4 die antwort

Wie man den Anfang und das Ende von Satzmarkierungen mit quanteda @ behä

Ich versuche, 3 Gramm mit Rs zu erstellenquanteda package. Ich habe Mühe, einen Weg zu finden, um den Anfang und das Ende der Satzmarkierungen in n-Gramm zu halte<s> und</s> wie im Code unten. Ich dachte, dass mit demkeptFeatures mit einem ...

3 die antwort

Dictionary () wird im tm-Paket nicht mehr unterstützt. Wie kann man Code emendieren?

Mir ist erst nach dem Update auf aufgefallentm v. 0.5-10 die FunktionDictionary() wird nicht mehr unterstützt. Ist das ein Fehler? Oder war es veraltet? Soll ich zum Erstellen eines Wörterbuchs eine andere Funktion verwenden? Da ich jetzt viele ...

4 die antwort

stemCompletion funktioniert nicht

Ich verwende das TM-Paket für die Textanalyse von Reparaturdaten, das Lesen von Daten in einen Datenrahmen, die Konvertierung in ein Corpus-Objekt sowie verschiedene Methoden zum Bereinigen von Daten mithilfe von "lower", "stipWhitespace", ...

2 die antwort

Entfernen zu häufiger Wörter (kommen in mehr als 80% der Dokumente vor) in R

Ich arbeite mit dem 'tm'-Paket, um ein Korpus zu erstellen. Ich habe die meisten Vorverarbeitungsschritte durchgeführt. Der Rest besteht darin, zu häufige Wörter zu entfernen (Begriffe, die in mehr als 80% der Dokumente vorkommen). Kann ...

2 die antwort

R: Titel zu wordcloud graphics / png hinzufügen

Ich habe einen funktionierenden R-Code, der eine Tag-Cloud aus einer Term-Document-Matrix generiert.Jetzt möchte ich aus vielen Dokumenten eine ganze Reihe v...

3 die antwort

R-Korpus verwirrt meinen UTF-8-kodierten Text

Ich versuche einfach, ein Korpus aus russischem UTF-8-codiertem Text zu erstellen. Das Problem ist, die Corpus-Methode aus dertm Paket codiert die Zeichenfolgen nicht richtig. Hier ist ein reproduzierbares Beispiel für mein Problem: Laden Sie ...

2 die antwort

Entfernen von nicht englischsprachigem Text aus Corpus in R mit tm ()

ich benutze