Suchergebnisse für Anfrage "data.table"
Doppelte Zeilen mit dem ursprünglichen @ find
Ich kann doppelte Zeilen in @ bekommR auf einendata.table dt using dt[duplicated(dt, by=someColumns)] Ich möchte jedoch Paare doppelter Zeilen und die "Nicht-Duplikate" erhalten, z. B.dt: col1, col2, col3 A B C1 A B C2 A B1 ...
using eval in data.table
Ich versuche das Verhalten von eval in einer data.table als "Frame" zu verstehen. Mit folgenden Daten.Tabelle: set.seed(1) foo = data.table(var1=sample(1:3,1000,r=T), var2=rnorm(1000), var3=sample(letters[1:5],1000,replace = T)) Ich versuche, ...
Splitting Textspalte in zerlumpte mehrere neue Spalten in einer Datentabelle in R
Ich habe eine Datentabelle mit mehr als 20000 Zeilen und einer Spalte. Die Zeichenfolge in jeder Spalte hat eine unterschiedliche Anzahl von Wörtern. Ich möchte die Wörter aufteilen und sie in eine neue Spalte einfügen. Ich weiß, wie ich es Wort ...
'Embedded nul in string' beim Importieren einer großen CSV (8 GB) mit fread ()
Ich habe eine große CSV-Datei (8,1 GB), die ich in R einbinden möchte. Ich habe die CSV mit Pythons csvkit erstellt.in2csv, konvertiert von einer .txt-Datei, aber irgendwie führte die Konvertierung dazu, dass Null-Zeichen in der Datei angezeigt ...
R (data.table) gruppiert Daten nach benutzerdefiniertem Bereich (z. B. -18, 18-25,…, 65 +)
Ich kann in R (mithilfe von data.table) keine Lösung finden, um Daten nach einem benutzerdefinierten Bereich (z. B. -18, 18-25, ..., 65+) und nicht nach einem einzelnen Wert zu gruppieren. Was ich gerade ...
Erstelle eine neue Spalte basierend auf der Bedingung, die innerhalb eines fortlaufenden Datums existiert
Um diese Frage zu verallgemeinern, könnte sie meines Erachtens auch folgendermaßen umformuliert werden:Erstellen einer rollenden zeitempfindlichen Faktorvariablen. Dies ist zwar eine ungewöhnliche Anforderung, kann jedoch für viele verschiedene ...
segfault von C-Stapelüberlauf in R mit data.table
Ich verwende das Paket data.table in R, um einen großen Datenrahmen (65046 Zeilen, 101959 Spalten) zu lesen. fread arbeitet bei mir für kleinere dataframes. Wenn ich versuche, den gewünschten Datenrahmen zu lesen, wird die folgende Fehlermeldung ...
dplyr auf data.table, verwende ich data.table wirklich?
Wenn ich benutze dplyr -Syntax über einemDatentabell, bekomme ich alle Geschwindigkeitsvorteile von datatable, während ich immer noch die Syntax von dplyr verwende? Mit anderen Worten, verwende ich die Datentabelle falsch, wenn ich sie mit ...
Werte der falschen Gruppe werden verwendet, wenn plot () in einer data.table () in RStudio @ verwendet wir
Ich möchte ein geteiltes Diagramm erstellen. Im oberen Bereich des Diagramms werden die Werte der Gruppea, auf der unteren die Werte der Gruppeb sollte benutzt werden. Ich benutzedata.table() um dies zu tun. Hier ist der Code, mit dem ich ein ...
Ist es möglich, die Überlappungen der Funktion R data.table zu verwenden, um den Schnittpunkt überlappender Bereiche in zwei Tabellen zu ermitteln?
Ich möchte Foverlaps verwenden, um die Schnittbereiche von zwei Bettdateien zu ermitteln und alle Zeilen mit überlappenden Bereichen zu einer einzigen Zeile zusammenzufassen. Im folgenden Beispiel habe ich zwei Tabellen mit Genombereichen. Die ...