Использование таблицы на подмножестве дает частоты для всего DF, а не подмножества
Я использую подмножество для извлечения из набора значений столбца
У меня есть DF с несколькими столбцами, один из которых государственный. Мне нужно получить частоты для состояния, но только для некоторого набора состояний. Итак, у меня есть это:
tmp <- subset(DF, DF$STATE %in% SOMESTATES)
a <- as.data.frame(table(tmp$STATE))
Это почти нормально. Во фрейме данных tmp есть только записи, принадлежащие множеству SOMESTATES, хорошо.
Вопрос в том. Результатом таблицы являются полные частоты для всего DF, а не только tmp. Другой имеет нулевые значения.
Моя проблема здесь в том, что некоторые состояния в SOMESTATES отсутствуют в DF, что не позволяет мне использовать уровни снижения. droplevels вынимает и те нулевые значения. Здесь также:
Например, если я использую такие уровни снижения, я теряю нулевые значения для некоторых состояний, которые мне нужны.
tmp <- subset(DF, DF$STATE %in% SOMESTATES)
tmp2 <- droplevels(tmp)
table(tmp2$STATE)
представляет все штаты не только в СОМЕСТАХ
Любой совет ценится