R - Agrupe por variável e atribua um ID exclusivo
Estou interessado em desidentificar um conjunto de dados confidenciais com valores fixados no tempo e variantes no tempo. Desejo (a) agrupar todos os casos por número de previdência social, (b) atribuir a esses casos um ID exclusivo e (c) remover o número de previdência social.
Aqui está um exemplo de conjunto de dados:
personal_id gender temperature
111-11-1111 M 99.6
999-999-999 F 98.2
111-11-1111 M 97.8
999-999-999 F 98.3
888-88-8888 F 99.0
111-11-1111 M 98.9
Qualquer solução seria muito apreciada.