Fuzzy coincidencia utilizando T-SQL
Tengo una mesa Personas con datos personales, etc. Hay muchas columnas, pero las de interés aquí son:addressindex
, lastname
yfirstname
dóndeaddressindex
es una dirección única taladrada hasta la puerta del apartamento. Entonces, si tengo 'como abajo' dos personas con lalastname
y uno elfirstnames
son los mismos, probablemente sean duplicados.
Necesito una forma de enumerar estos duplicados.
tabledata:
personid 1
firstname "Carl"
lastname "Anderson"
addressindex 1
personid 2
firstname "Carl Peter"
lastname "Anderson"
addressindex 1
Sé cómo hacer esto si tuviera que coincidir exactamente en todas las columnas, pero necesito una coincidencia difusa para hacer el truco con (del ejemplo anterior) un resultado como:
Row personid addressindex lastname firstname
1 2 1 Anderson Carl Peter
2 1 1 Anderson Carl
.....
¿Alguna sugerencia sobre cómo resolver esto de una buena manera?