Mesclar parcialmente dois conjuntos de dados e preencher NAs em R
Eu tenho dois conjuntos de dados
a
= conjunto de dados brutos com milhares de observações de diferentes eventos climáticos
STATE EVTYPE
1 AL WINTER STORM
2 AL TORNADO
3 AL TSTM WIND
4 AL TSTM WIND
5 AL TSTM WIND
6 AL HAIL
7 AL HIGH WIND
8 AL TSTM WIND
9 AL TSTM WIND
10 AL TSTM WIND
b
= uma tabela de dicionário, que possui uma ortografia padrão para alguns eventos climáticos.
EVTYPE evmatch
1 HIGH SURF ADVISORY <NA>
2 COASTAL FLOOD COASTAL FLOOD
3 FLASH FLOOD FLASH FLOOD
4 LIGHTNING LIGHTNING
5 TSTM WIND <NA>
6 TSTM WIND (G45) <NA>
ambos são mesclados emdf_new
porevtype
library(dplyr)
df_new <- left_join(a, b, by = c("EVTYPE"))
STATE EVTYPE evmatch
1 AL WINTER STORM WINTER STORM
2 AL TORNADO NA
3 AL TSTM WIND THUNDERSTORM WIND
4 AL TSTM WIND THUNDERSTORM WIND
5 AL TSTM WIND THUNDERSTORM WIND
6 AL HAIL NA
7 AL HIGH WIND HIGH WIND
8 AL TSTM WIND THUNDERSTORM WIND
9 AL TSTM WIND THUNDERSTORM WIND
10 AL TSTM WIND THUNDERSTORM WIND
11 AL HEAVY RAIN NA
12 AL FLASH FLOOD NA
13 AL TSTM WIND THUNDERSTORM WIND
14 AL HEAVY RAIN NA
15 AL TSTM WIND THUNDERSTORM WIND
Preencha as NAs ausentesComo você pode ver nodf_new$evmatch
, existem NAs. Como posso mesclar o conjunto de dados, mas ter todos os NAs emevmatch
preenchido pela palavra correspondente deEVTYPE
. Por exemplo...
STATE EVTYPE evmatch
1 AL WINTER STORM WINTER STORM
2 AL TORNADO TORNADO
3 AL TSTM WIND THUNDERSTORM WIND
4 AL TSTM WIND THUNDERSTORM WIND
5 AL TSTM WIND THUNDERSTORM WIND
6 AL HAIL HAIL
7 AL HIGH WIND HIGH WIND
8 AL TSTM WIND THUNDERSTORM WIND
9 AL TSTM WIND THUNDERSTORM WIND
10 AL TSTM WIND THUNDERSTORM WIND
11 AL HEAVY RAIN HEAVY RAIN
12 AL FLASH FLOOD FLASH FLOOD
13 AL TSTM WIND THUNDERSTORM WIND
14 AL HEAVY RAIN HEAVY RAIN
15 AL TSTM WIND THUNDERSTORM WIND