Suchergebnisse für Anfrage "dplyr"
Ersetzen Sie fehlende Werte (NA) durch die letzten Nicht-NA nach Gruppe
Ich möchte das folgende Problem mit dplyr lösen. Am liebsten mit einer der Fensterfunktionen. Ich habe einen Datenrahmen mit Häusern und Kaufpreisen. Folgendes ist ein Beispiel: houseID year price 1 1995 NA 1 1996 100 1 1997 NA 1 1998 120 1 1999 ...
Unterschiede zwischen%.% (Dplyr) und%>% (magrittr)
Dasdplyr Paket stellte die%.% Operator, der die linke Seite als Argument der Funktion auf der rechten Seite übergibt, ähnlich einer * NIX-Pipe. Dasmagrittr package ist ein viel leichteres Paket, das nur zur Definition dieses Pipe-ähnlichen ...
Erstellen eines "anderen" Feldes
Im Moment habe ich den folgenden data.frame, der von erstellt wurdeoriginal.df %.% group_by(Category) %.% tally() %.% arrange(desc(n)). DF <- structure(list(Category = c("E", "K", "M", "L", "I", "A", "S", "G", "N", "Q"), n = c(163051, 127133, ...
Schnelleres Füllen der i, j-Matrixzellen
Ich möchte Spalten eines data.frame / matrix nehmen und eine Funktion zwischen jeder Zelle anwenden ([i, j]) des Datenrahmens, wobei i und j die Folgen entlang der Spalten des Datenrahmens sind. Grundsätzlich möchte ich eine Matrix aus einzelnen ...
Das zeilenweise Setzen von Wertezählungen in neue Variablen, wie macht man das in R mit dplyr?
Ich habe einen großen Datenrahmen (df), der so aussieht: structure(list(var1 = c(1, 2, 3, 4, 2, 3, 4, 3, 2), var2 = c(2, 3, 4, 1, 2, 1, 1, 1, 3), var3 = c(4, 4, 2, 3, 3, 1, 1, 1, 4), var4 = c(2, 2, 2, 2, 3, 2, 3, 4, 1), var5 = c(4, 4, 2, 3, 3, ...
eindeutige Zeilen in dplyr: row_number () von tbl_dt inkonsistent zu tbl_df
en bref: Ich frage mich, wie man eindeutige Zeilen von a erhältdata.table in einem irgendwo entlang einerdplyr Arbeitsablauf. Seit v0.2 kann ich verwendenrow_number==1 (sehen: Doppelte Zeilen mit dplyr ...
Das direkte Aktualisieren (Ersetzen) von Datenrahmen mit geringer Dichte ist langsam und ineffizient
Ich versuche ein paar hunderttausend JSON-Dateien einzulesen und sie schließlich in ein Dplyr-Objekt zu bekommen. Die JSON-Dateien sind jedoch keine einfache Schlüsselwertanalyse und erfordern eine umfangreiche Vorverarbeitung. ...
benutzerdefinierte Funktion nach Gruppierung von data.fame
Angesichts der folgenden data.frame d <- rep(c("a", "b"), each=5) l <- rep(1:5, 2) v <- 1:10 df <- data.frame(d=d, l=l, v=v*v) df d l v 1 a 1 1 2 a 2 4 3 a 3 9 4 a 4 16 5 a 5 25 6 b 1 36 7 b 2 49 8 b 3 64 9 b 4 81 10 b 5 100Jetzt möchte ich eine ...
dplyr :: do () benötigt eine benannte Funktion?
Folgendes funktioniert gut: library(dplyr) m <- function(df) { mod <- lm(Sepal.Length ~ Sepal.Width, data = df) pred <- predict(mod,newdata = df["Sepal.Width"]) data.frame(df,pred) } iris %>% group_by(Species) %>% do(m(.))Ich dachte, dass dies ...
Kann das Paket dplyr für die bedingte Mutation verwendet werden?
Kann die Mutation verwendet werden, wenn die Mutation bedingt ist (abhängig von den Werten bestimmter Spaltenwerte)? Dieses Beispiel zeigt, was ich meine. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, ...