Suchergebnisse für Anfrage "data.table"
Datentabelle transponieren
Was wäre ein guter Weg, um eine Datentabelle effizient zu transformieren, nachdem die Datenberechnung beendet ist?
data.table löscht Schlüsselzeilen und fasst zusammen
Ich suche nach einer eleganten Methode, um den Schlüssel von data.table zu durchlaufen, die Zeilen mit diesem Schlüssel zu löschen und dann eine Zusammenfassung über die verbleibenden Zeilen zu erstellen. Zum Beispiel: mydt <- ...
Fehler beim Zusammenführen von Datenrahmen mit dem Paket "data.table"
Folgendes ist areproduzierbares Beispieleiner Situation, die ich erlebe und in der ich stecke (es ist eineTest-Client Ich benutze, um verschiedene Ansätze zu bewertenZusammenführen von Datensätzenfür meine Dissertationsforschung). testData ...
Werte unterschiedlicher Länge teilen und an Spalten binden
Ich habe einen ziemlich großen Datensatz (ca. 100.000 Beobachtungen), ähnlich dem folgenden: data <- data.frame( ID = seq(1, 5, 1), Values = c("1,2,3", "4", " ", "4,1,6,5,1,1,6", "0,0"), stringsAsFactors=F) data ID Values 1 1 1,2,3 2 2 4 3 3 4 4 ...
Was ist die leistungsstärkere Alternative zu for-Schleifen, um Daten nach Gruppen-ID zu unterteilen?
Ein wiederkehrendes Analyseparadigma, auf das ich in meiner Forschung stoße, ist die Notwendigkeit, eine Teilmenge basierend auf allen unterschiedlichen Gruppen-ID-Werten zu erstellen, statistische Analysen für jede Gruppe durchzuführen und die ...
Effizienteres Erstellen eines Korpus und eines DTM mit 4 Millionen Zeilen
Meine Datei hat mehr als 4 Millionen Zeilen und ich benötige eine effizientere Methode, um meine Daten in eine Korpus- und Dokumentterm-Matrix zu konvertieren, sodass ich sie an einen Bayes-Klassifikator übergeben kann. Betrachten Sie den ...
Fügen Sie einer data.table, die viele Variablen enthält, neue Spalten hinzu
Ich möchte gleichzeitig viele neue Spalten zu einem hinzufügendata.table basierend auf Gruppenberechnungen. Ein funktionierendes Beispiel meiner Daten würde ungefähr so aussehen: Time Stock x1 x2 x3 1: 2014-08-22 A 15 27 34 2: 2014-08-23 A 39 44 ...
Wie wird eine lineare Kombination von Variablen und Aktualisierungstabelle mit data.table in einem Schleifenaufruf generiert?
Einige Spielzeugdatenset.seed(123) df <- data.frame(what_ever = rnorm(5, 50, 1), this_is = rnorm(5, 30, 1), wtf_nnn = rnorm(5, 20, 1), hat_ever = rnorm(5, 50, 1), who_is = rnorm(5, 30, 1), mmm_nnn = rnorm(5, 20, 1) ) library(data.table) DT <- ...
fread und ein zitierter mehrzeiliger Spaltenwert
> fread('col1,col2\n') Empty data.table (0 rows) of 2 cols: col1,col2 > fread('col1,col2\n5,4') col1 col2 1: 5 4 > fread('col1,col2\n5,"4\n3"') Error in fread("col1,col2\n5,\"4\n3\"") : Unbalanced quote (") observed on this line: 3" >read.csv ...