data.table «ключевые индексы» или «групповой счетчик»
После создания ключа в data.table:
set.seed(12345)
DT <- data.table(x = sample(LETTERS[1:3], 10, replace = TRUE),
y = sample(LETTERS[1:3], 10, replace = TRUE))
setkey(DT, x, y)
DT
# x y
# [1,] A B
# [2,] A B
# [3,] B B
# [4,] B B
# [5,] C A
# [6,] C A
# [7,] C A
# [8,] C A
# [9,] C C
# [10,] C C
Я хотел бы получить целочисленный вектор, дающий каждой строке соответствующий «индекс ключа». Я надеюсь, что ожидаемый результат (столбецi
) ниже поможет уточнить, что я имею в виду:
# x y i
# [1,] A B 1
# [2,] A B 1
# [3,] B B 2
# [4,] B B 2
# [5,] C A 3
# [6,] C A 3
# [7,] C A 3
# [8,] C A 3
# [9,] C C 4
# [10,] C C 4
Я думал об использовании чего-то вродеcumsum(!duplicated(DT[, key(DT), with = FALSE]))
но я надеюсь, что есть лучшее решение. Я чувствую, что этот вектор может быть частью внутреннего представления таблицы, и, возможно, есть способ получить к нему доступ? Даже если это не так, что бы вы предложили?