почему в data.table для ключа «символ часто предпочтительнее фактора»?

Изdata.table руководство по эксплуатации:

На самом деле нам так нравится, что data.table содержит алгоритм сортировки для векторов символов, использующий внутренний глобальный строковый кеш R. Это особенно быстро для символьных векторов, содержащих много дубликатов, таких как сгруппированные данные в ключевом столбце. Это означает, что характер часто предпочтительнее фактора. Факторы все еще полностью поддерживаются, в частности упорядоченные факторы (где уровни не в алфавитном порядке).

неfactor просто целое число, которое должно быть легче сделатьcounting sort чемcharacter?

Ответы на вопрос(1)

Ваш ответ на вопрос