Сообщение «Добавление отсутствующих переменных группировки» в dplyr в R
У меня есть часть моего скрипта, которая раньше работала нормально, но в последнее время я производил странный оператор, после которого многие другие мои функции не работают должным образом. Я пытаюсь выбрать 8-ю и 23-ю позиции в ранжированном списке значений для каждого сайта, чтобы найти значения 25-го и 75-го процентиля для каждого дня в году для каждого сайта в течение 30 лет. Мой подход был следующим (адаптированным для набора данных из четырех строк - срез (3) будет срезом (23) для моего полного набора данных за 30 лет обычно):
library(“dplyr”)
mydata
structure(list(station_number = structure(c(1L, 1L, 1L, 1L), .Label = "01AD002", class = "factor"),
year = 1981:1984, month = c(1L, 1L, 1L, 1L), day = c(1L,
1L, 1L, 1L), value = c(113, 8.329999924, 15.60000038, 149
)), .Names = c("station_number", "year", "month", "day", "value"), class = "data.frame", row.names = c(NA, -4L))
value <- mydata$value
qu25 <- mydata %>%
group_by(month, day, station_number) %>%
arrange(desc(value)) %>%
slice(3) %>%
select(value)
Раньше я оставлял таблицу с одним значением на сайт для описания 25-го процентиля (так как функция упорядочивания, по-видимому, упорядочивает их по убыванию) Однако теперь, когда я запускаю эти строки, я получаю сообщение:
Adding missing grouping variables: `month`, `day`, `station_number`
Это сообщение не имеет смысла для меня, так как переменные группировки явно присутствуют в моей таблице. Кроме того, опять же, до недавнего времени это работало нормально. Я пытался:
detatch («plyr») - так как я загрузил его до dplyrdplyr :: group_by - размещает это прямо в строке group_byудаление и повторная установка dplyr, хотя это было для другой проблемы, которую я имелЕсть идеи, почему я могу получать это сообщение и почему оно перестало работать?
Спасибо за любую помощь.
Обновление: добавлен пример dput с одним сайтом, но значения на 1 января для нескольких лет. Можно надеяться, что позиционное значение будет возвращено после группировки, например, slice (3) вернет значение 15,6 для этого меньшего подмножества.