R RecordLinkage Identity
Ich arbeite mit RecordLinkage Library in R. Ich habe einen Datenrahmen mit ID, Name, Telefon, E-Mail
Mein Code sieht so aus:
ids = data$id
pairs = compare.dedup(data, identity=ids, blockfld=as.list(2,3,4))
Das Problem ist, dass meine IDs in meiner Ergebnisausgabe nicht identisch sind. Wenn ich also diese Daten hätte:
id Name Phone Mail
233 Nathali 2222 [email protected]
435 Nathali 2222
553 Jean 3444 [email protected]
In meiner Ergebnisausgabe werde ich so etwas wie @ hab
id1 id2
1 2
Anstatt vo
id1 id2
233 435
Ich möchte wissen, ob es eine Möglichkeit gibt, die IDs anstelle des Index beizubehalten, oder jemand könnte mir den Identitätsparameter erklären.
Vielen Dan