Kann ich NAs ersetzen, wenn ich zwei Datenrahmen mit dplyr verbinde?
Ich möchte zwei Datenrahmen verbinden. Einige der Spaltennamen überschneiden sich und es gibtNA
-Einträge in einer der überlappenden Spalten des Datenrahmens. Hier ist ein vereinfachtes Beispiel:
df1 <- data.frame(fruit = c('apples','oranges','bananas','grapes'), var1 = c(1,2,3,4), var2 = c(3,NA,6,NA), stringsAsFactors = FALSE)
df2 <- data.frame(fruit = c('oranges','grapes'), var2=c(5,6), var3=c(7,8), stringsAsFactors = FALSE)
Kann ich Dplyr-Join-Funktionen verwenden, um diese Datenrahmen zu verbinden und die Nicht-@ -Prioritäten automatisch zu setzeNA
eintrag damit ich die "var2" spalte ohne @ bekomNA
-Einträge im verknüpften Datenrahmen? Wie es jetzt ist, wenn ich @ anruleft_join
, es hält dasNA
Einträge, und wenn ich rufefull_join
es dupliziert die Zeilen.