Suchergebnisse für Anfrage "data.table"

2 die antwort

Doppelte Zeilen mit dem ursprünglichen @ find

Ich kann doppelte Zeilen in @ bekommR auf einendata.table dt using dt[duplicated(dt, by=someColumns)] Ich möchte jedoch Paare doppelter Zeilen und die "Nicht-Duplikate" erhalten, z. B.dt: col1, col2, col3 A B C1 A B C2 A B1 ...

1 die antwort

using eval in data.table

Ich versuche das Verhalten von eval in einer data.table als "Frame" zu verstehen. Mit folgenden Daten.Tabelle: set.seed(1) foo = data.table(var1=sample(1:3,1000,r=T), var2=rnorm(1000), var3=sample(letters[1:5],1000,replace = T)) Ich versuche, ...

5 die antwort

Splitting Textspalte in zerlumpte mehrere neue Spalten in einer Datentabelle in R

Ich habe eine Datentabelle mit mehr als 20000 Zeilen und einer Spalte. Die Zeichenfolge in jeder Spalte hat eine unterschiedliche Anzahl von Wörtern. Ich möchte die Wörter aufteilen und sie in eine neue Spalte einfügen. Ich weiß, wie ich es Wort ...

TOP-Veröffentlichungen

6 die antwort

'Embedded nul in string' beim Importieren einer großen CSV (8 GB) mit fread ()

Ich habe eine große CSV-Datei (8,1 GB), die ich in R einbinden möchte. Ich habe die CSV mit Pythons csvkit erstellt.in2csv, konvertiert von einer .txt-Datei, aber irgendwie führte die Konvertierung dazu, dass Null-Zeichen in der Datei angezeigt ...

4 die antwort

R (data.table) gruppiert Daten nach benutzerdefiniertem Bereich (z. B. -18, 18-25,…, 65 +)

Ich kann in R (mithilfe von data.table) keine Lösung finden, um Daten nach einem benutzerdefinierten Bereich (z. B. -18, 18-25, ..., 65+) und nicht nach einem einzelnen Wert zu gruppieren. Was ich gerade ...

2 die antwort

Erstelle eine neue Spalte basierend auf der Bedingung, die innerhalb eines fortlaufenden Datums existiert

Um diese Frage zu verallgemeinern, könnte sie meines Erachtens auch folgendermaßen umformuliert werden:Erstellen einer rollenden zeitempfindlichen Faktorvariablen. Dies ist zwar eine ungewöhnliche Anforderung, kann jedoch für viele verschiedene ...

0 die antwort

segfault von C-Stapelüberlauf in R mit data.table

Ich verwende das Paket data.table in R, um einen großen Datenrahmen (65046 Zeilen, 101959 Spalten) zu lesen. fread arbeitet bei mir für kleinere dataframes. Wenn ich versuche, den gewünschten Datenrahmen zu lesen, wird die folgende Fehlermeldung ...

6 die antwort

dplyr auf data.table, verwende ich data.table wirklich?

Wenn ich benutze dplyr -Syntax über einemDatentabell, bekomme ich alle Geschwindigkeitsvorteile von datatable, während ich immer noch die Syntax von dplyr verwende? Mit anderen Worten, verwende ich die Datentabelle falsch, wenn ich sie mit ...

2 die antwort

Werte der falschen Gruppe werden verwendet, wenn plot () in einer data.table () in RStudio @ verwendet wir

Ich möchte ein geteiltes Diagramm erstellen. Im oberen Bereich des Diagramms werden die Werte der Gruppea, auf der unteren die Werte der Gruppeb sollte benutzt werden. Ich benutzedata.table() um dies zu tun. Hier ist der Code, mit dem ich ein ...

8 die antwort

Ist es möglich, die Überlappungen der Funktion R data.table zu verwenden, um den Schnittpunkt überlappender Bereiche in zwei Tabellen zu ermitteln?

Ich möchte Foverlaps verwenden, um die Schnittbereiche von zwei Bettdateien zu ermitteln und alle Zeilen mit überlappenden Bereichen zu einer einzigen Zeile zusammenzufassen. Im folgenden Beispiel habe ich zwei Tabellen mit Genombereichen. Die ...