Suchergebnisse für Anfrage "dplyr"

6 die antwort

Ersetzen Sie fehlende Werte (NA) durch die letzten Nicht-NA nach Gruppe

Ich möchte das folgende Problem mit dplyr lösen. Am liebsten mit einer der Fensterfunktionen. Ich habe einen Datenrahmen mit Häusern und Kaufpreisen. Folgendes ist ein Beispiel: houseID year price 1 1995 NA 1 1996 100 1 1997 NA 1 1998 120 1 1999 ...

2 die antwort

Unterschiede zwischen%.% (Dplyr) und%>% (magrittr)

Dasdplyr Paket stellte die%.% Operator, der die linke Seite als Argument der Funktion auf der rechten Seite übergibt, ähnlich einer * NIX-Pipe. Dasmagrittr package ist ein viel leichteres Paket, das nur zur Definition dieses Pipe-ähnlichen ...

3 die antwort

Erstellen eines "anderen" Feldes

Im Moment habe ich den folgenden data.frame, der von erstellt wurdeoriginal.df %.% group_by(Category) %.% tally() %.% arrange(desc(n)). DF <- structure(list(Category = c("E", "K", "M", "L", "I", "A", "S", "G", "N", "Q"), n = c(163051, 127133, ...

TOP-Veröffentlichungen

1 die antwort

Schnelleres Füllen der i, j-Matrixzellen

Ich möchte Spalten eines data.frame / matrix nehmen und eine Funktion zwischen jeder Zelle anwenden ([i, j]) des Datenrahmens, wobei i und j die Folgen entlang der Spalten des Datenrahmens sind. Grundsätzlich möchte ich eine Matrix aus einzelnen ...

3 die antwort

Das zeilenweise Setzen von Wertezählungen in neue Variablen, wie macht man das in R mit dplyr?

Ich habe einen großen Datenrahmen (df), der so aussieht: structure(list(var1 = c(1, 2, 3, 4, 2, 3, 4, 3, 2), var2 = c(2, 3, 4, 1, 2, 1, 1, 1, 3), var3 = c(4, 4, 2, 3, 3, 1, 1, 1, 4), var4 = c(2, 2, 2, 2, 3, 2, 3, 4, 1), var5 = c(4, 4, 2, 3, 3, ...

2 die antwort

eindeutige Zeilen in dplyr: row_number () von tbl_dt inkonsistent zu tbl_df

en bref: Ich frage mich, wie man eindeutige Zeilen von a erhältdata.table in einem irgendwo entlang einerdplyr Arbeitsablauf. Seit v0.2 kann ich verwendenrow_number==1 (sehen: Doppelte Zeilen mit dplyr ...

1 die antwort

Das direkte Aktualisieren (Ersetzen) von Datenrahmen mit geringer Dichte ist langsam und ineffizient

Ich versuche ein paar hunderttausend JSON-Dateien einzulesen und sie schließlich in ein Dplyr-Objekt zu bekommen. Die JSON-Dateien sind jedoch keine einfache Schlüsselwertanalyse und erfordern eine umfangreiche Vorverarbeitung. ...

4 die antwort

benutzerdefinierte Funktion nach Gruppierung von data.fame

Angesichts der folgenden data.frame d <- rep(c("a", "b"), each=5) l <- rep(1:5, 2) v <- 1:10 df <- data.frame(d=d, l=l, v=v*v) df d l v 1 a 1 1 2 a 2 4 3 a 3 9 4 a 4 16 5 a 5 25 6 b 1 36 7 b 2 49 8 b 3 64 9 b 4 81 10 b 5 100Jetzt möchte ich eine ...

2 die antwort

dplyr :: do () benötigt eine benannte Funktion?

Folgendes funktioniert gut: library(dplyr) m <- function(df) { mod <- lm(Sepal.Length ~ Sepal.Width, data = df) pred <- predict(mod,newdata = df["Sepal.Width"]) data.frame(df,pred) } iris %>% group_by(Species) %>% do(m(.))Ich dachte, dass dies ...

5 die antwort

Kann das Paket dplyr für die bedingte Mutation verwendet werden?

Kann die Mutation verwendet werden, wenn die Mutation bedingt ist (abhängig von den Werten bestimmter Spaltenwerte)? Dieses Beispiel zeigt, was ich meine. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, ...